루비 문자열 (문자열)란?

Ruby 코스
Ruby 고급 자습서

최고의 루비 문자열 (문자열) 튜토리얼 2024년, 이 튜토리얼에서는 이스케이프 문자,문자 인코딩,문자열 내장 방법,포장을 풀고 명령 문자열,를 배울 수 있습니다.

루비 문자열 (문자열)

이전 : 루비 모듈 (모듈)

다음 : 루비 배열 (배열)

루비 캐릭터 오브젝트가 저장 또는 하나 이상의 바이트 순서를 조작하기 위해 사용된다.

이중 인용 문자열이 더 이스케이프 문자를 지원할 수 있다는 점을 제외하고 단일 인용 문자열 ( ')를 두 번 인용 문자열 ( ")로 루비 문자열.

단일 인용 문자열

가장 간단한 문자열, 즉, 작은 따옴표 메모리에서 문자열을 넣어 단일 인용 문자열을 수 있습니다 :

'这是一个 Ruby 程序的字符串'

당신이 따옴표 작은 따옴표 문자열을 사용해야하는 경우, 당신은 루비 인터프리터가이 작은 따옴표 문자 기호 문자열을 종료하고 있다고 생각하지 않도록, 백 슬래시 (\)로 단일 인용 문자열이 필요합니다 :

'Won\'t you read O\'Reilly\'s book?'

두 번째 백 슬래시 자체가 이스케이프 문자로 해석되지 않도록 백 슬래시는 다른 백 슬래시를 이스케이프합니다.

다음은 루비 문자열 관련 기능이다.

두 번 인용 문자열

이중 인용 된 문자열에서, 우리는 파운드 기호# {} 괄호 계산 식의 값을 사용할 수 있습니다 :

문자열 포함 된 변수 :

#!/usr/bin/ruby
# -*- coding: UTF-8 -*-

name1 = "Joe"
name2 = "Mary"
puts "你好 #{name1},  #{name2} 在哪?"

위의 예제 출력을 실행의 출력은 다음과 같습니다

你好 Joe,  Mary 在哪?

문자열 수학 연산 :

#!/usr/bin/ruby
# -*- coding: UTF-8 -*-

x, y, z = 12, 36, 72
puts "x 的值为 #{ x }"
puts "x + y 的值为 #{ x + y }"
puts "x + y + z 的平均值为 #{ (x + y + z)/3 }"

위의 예제 출력을 실행의 출력은 다음과 같습니다

x 的值为 12
x + y 的值为 48
x + y + z 的平均值为 40

시작 루비는 단일 인용 규칙을 사용하여 문자열 변수, % q를 안내하기 위해 사용 %의 q 및 % Q를 지원하고 %의 Q 나중에 (A 다음에 두 번 인용 규칙입니다! [{등을 분리 및}]), 따라서 종료 구분자.

질문 또는 q 문자 뒤에 다음 단락 구분은 어떤 영숫자가 아닌 단일 바이트 문자 등이 될 수 있습니다! [{(<, 등, 문자열은 항상 일치하는 항목을 찾아 읽 터미네이터에 도달했습니다.

#!/usr/bin/ruby
# -*- coding: UTF-8 -*-

desc1 = %Q{Ruby 的字符串可以使用 '' 和 ""。}
desc2 = %q|Ruby 的字符串可以使用 '' 和 ""。|

puts desc1
puts desc2

위의 예제 출력을 실행의 출력은 다음과 같습니다

Ruby 的字符串可以使用 '' 和 ""。
Ruby 的字符串可以使用 '' 和 ""。

이스케이프 문자

지수는 백 슬래시 탈출 또는 문자가 문자를 인쇄하는 데 사용할 수있는 탈출 나열합니다.

큰 따옴표로 묶인 문자열 내에서 캐릭터가 해결 될 것 탈출: 있습니다.작은 따옴표의 문자열에서 문자가 출력으로 해석되지 않습니다 탈출.

백 슬래시	진수 문자	기술
\	0x07 인	알람 기호
\ B	을 0x08	백 스페이스 키
\ CX		제어-X
\ CX		제어-X
\ E	0x1b	탈출
\ F	0x0c	페이지 나누기
\ M- \ CX		메타 제어-X
\ N	0x0a	줄 바꿈
\ NNN		n은 0.7의 범위는 8 진수,
\ R	0x0d로	캐리지 리턴
\ S	로 0x20	공백
\ T	은 0x09	탭
\ V	에는 0x0B	수직 탭
\ X		문자 X
\ Xnn		n은 0.9, AF 또는 AF 범위 진수 표기법,

문자 인코딩

루비의 기본 문자 집합은 ASCII는 단일 바이트 문자를 사용할 수 있습니다. 당신은 UTF-8 또는 다른 현대 문자 세트를 사용하는 경우, 문자가 1 내지 4 개의 바이트로 표현 될 수있다.

다음과 같이, 문자 세트를 변경 $ KCODE의 시작 프로그램을 사용할 수있다 :

$ KCODE = 'U'

여기에 $ KCODE 수있는 값입니다.

编码	描述
a	ASCII （与 none 相同）。这是默认的。
e	EUC。
n	None （与 ASCII 相同）。
u	UTF-8。

문자열 내장 방법

우리는 문자열 메소드를 호출하는 String 객체의 인스턴스가 필요합니다. 다음은 String 객체의 인스턴스를 생성하는 방법은 다음과 같습니다 :

new [String.new(str="")]

이 새로운 문자열 객체STR의복사본을 포함 반환합니다. 이제,STR 개체를사용하여, 우리는 어떤 인스턴스 방법을 사용할 수 호출 할 수 있습니다. 예를 들면 :

#!를 / usr / 빈 / 루비

myStr = String.new ( "이것은 테스트입니다")
foo는 = myStr.downcase

"# {foo는}"두고

이것은 다음과 같은 결과를

이 테스트입니다

다음은 일반적인 문자열 방법입니다 (가정 캐릭터 라인은 String 객체이다)

序号	方法 & 描述
1	str % arg 使用格式规范格式化字符串。如果 arg 包含一个以上的替代，那么 arg 必须是一个数组。如需了解更多格式规范的信息，请查看"内核模块"下的 sprintf。
2	*str integer** 返回一个包含 integer 个 str 的新的字符串。换句话说，str 被重复了 integer 次。
3	str + other_str 连接 other_str 到 str。
4	str << obj 连接一个对象到字符串。如果对象是范围为 0.255 之间的固定数字 Fixnum，则它会被转换为一个字符。把它与 concat 进行比较。
5	str <=> other_str 把 str 与 other_str 进行比较，返回 -1（小于）、0（等于）或 1（大于）。比较是区分大小写的。
6	str == obj 检查 str 和 obj 的相等性。如果 obj 不是字符串，则返回 false，如果 str <=> obj，则返回 true，返回 0。
7	str =~ obj 根据正则表达式模式 obj 匹配 str。返回匹配开始的位置，否则返回 false。
8
9	str.capitalize 把字符串转换为大写字母显示。
10	str.capitalize! 与 capitalize 相同，但是 str 会发生变化并返回。
11	str.casecmp 不区分大小写的字符串比较。
12	str.center 居中字符串。
13	str.chomp 从字符串末尾移除记录分隔符（$/），通常是 \n。如果没有记录分隔符，则不进行任何操作。
14	str.chomp! 与 chomp 相同，但是 str 会发生变化并返回。
15	str.chop 移除 str 中的最后一个字符。
16	str.chop! 与 chop 相同，但是 str 会发生变化并返回。
17	str.concat(other_str) 连接 other_str 到 str。
18	str.count(str, ko.) 给一个或多个字符集计数。如果有多个字符集，则给这些集合的交集计数。
19	str.crypt(other_str) 对 str 应用单向加密哈希。参数是两个字符长的字符串，每个字符的范围为 a.z、 A.Z、 0.9、 . 或 /。
20	str.delete(other_str, ko.) 返回 str 的副本，参数交集中的所有字符会被删除。
21	str.delete!(other_str, ko.) 与 delete 相同，但是 str 会发生变化并返回。
22	str.downcase 返回 str 的副本，所有的大写字母会被替换为小写字母。
23	str.downcase! 与 downcase 相同，但是 str 会发生变化并返回。
24	str.dump 返回 str 的版本，所有的非打印字符被替换为 \nnn 符号，所有的特殊字符被转义。
25	str.each(separator=$/) { \|substr\| block } 使用参数作为记录分隔符（默认是 $/）分隔 str，传递每个子字符串给被提供的块。
26	str.each_byte { \|fixnum\| block } 传递 str 的每个字节给 block，以字节的十进制表示法返回每个字节。
27	str.each_line(separator=$/) { \|substr\| block } 使用参数作为记录分隔符（默认是 $/）分隔 str，传递每个子字符串给被提供的 block。
28	str.empty? 如果 str 为空（即长度为 0），则返回 true。
29	str.eql?(other) 如果两个字符串有相同的长度和内容，则这两个字符串相等。
30	str.gsub(pattern, replacement) [or] str.gsub(pattern) { \|match\| block } 返回 str 的副本，pattern 的所有出现都替换为 replacement 或 block 的值。pattern 通常是一个正则表达式 Regexp；如果是一个字符串 String，则没有正则表达式元字符被解释（即，/\d/ 将匹配一个数字，但 '\d' 将匹配一个反斜杠后跟一个 'd'）。
31	str[fixnum] [or] str[fixnum,fixnum] [or] str[range] [or] str[regexp] [or] str[regexp, fixnum] [or] str[other_str] 使用下列的参数引用 str：参数为一个 Fixnum，则返回 fixnum 的字符编码；参数为两个 Fixnum，则返回一个从偏移（第一个 fixnum）开始截至到长度（第二个 fixnum）为止的子字符串；参数为 range，则返回该范围内的一个子字符串；参数为 regexp，则返回匹配字符串的部分；参数为带有 fixnum 的 regexp，则返回 fixnum 位置的匹配数据；参数为 other_str，则返回匹配 other_str 的子字符串。一个负数的 Fixnum 从字符串的末尾 -1 开始。
32	str[fixnum] = fixnum [or] str[fixnum] = new_str [or] str[fixnum, fixnum] = new_str [or] str[range] = aString [or] str[regexp] =new_str [or] str[regexp, fixnum] =new_str [or] str[other_str] = new_str ] 替换整个字符串或部分字符串。与 slice! 同义。
33	str.gsub!(pattern, replacement) [or] str.gsub!(pattern) { \|match\| block } 执行 String#gsub 的替换，返回 str，如果没有替换被执行则返回 nil。
34	str.hash 返回一个基于字符串长度和内容的哈希。
35	str.hex 把 str 的前导字符当作十六进制数字的字符串（一个可选的符号和一个可选的 0x），并返回相对应的数字。如果错误则返回零。
36	str.include? other_str [or] str.include? fixnum 如果 str 包含给定的字符串或字符，则返回 true。
37	str.index(substring [, offset]) [or] str.index(fixnum [, offset]) [or] str.index(regexp [, offset]) 返回给定子字符串、字符（fixnum）或模式（regexp）在 str 中第一次出现的索引。如果未找到则返回 nil。如果提供了第二个参数，则指定在字符串中开始搜索的位置。
38	str.insert(index, other_str) 在给定索引的字符前插入 other_str，修改 str。负值索引从字符串的末尾开始计数，并在给定字符后插入。其意图是在给定的索引处开始插入一个字符串。
39	str.inspect 返回 str 的可打印版本，带有转义的特殊字符。
40	str.intern [or] str.to_sym 返回与 str 相对应的符号，如果之前不存在，则创建符号。
41	str.length 返回 str 的长度。把它与 size 进行比较。
42	str.ljust(integer, padstr=' ') 如果 integer 大于 str 的长度，则返回长度为 integer 的新字符串，新字符串以 str 左对齐，并以 padstr 作为填充。否则，返回 str。
43	str.lstrip 返回 str 的副本，移除了前导的空格。
44	str.lstrip! 从 str 中移除前导的空格，如果没有变化则返回 nil。
45	str.match(pattern) 如果 pattern 不是正则表达式，则把 pattern 转换为正则表达式 Regexp，然后在 str 上调用它的匹配方法。
46	str.oct 把 str 的前导字符当作十进制数字的字符串（一个可选的符号），并返回相对应的数字。如果转换失败，则返回 0。
47	str.replace(other_str) 把 str 中的内容替换为 other_str 中的相对应的值。
48	str.reverse 返回一个新字符串，新字符串是 str 的倒序。
49	str.reverse! 逆转 str，str 会发生变化并返回。
50	str.rindex(substring [, fixnum]) [or] str.rindex(fixnum [, fixnum]) [or] str.rindex(regexp [, fixnum]) 返回给定子字符串、字符（fixnum）或模式（regexp）在 str 中最后一次出现的索引。如果未找到则返回 nil。如果提供了第二个参数，则指定在字符串中结束搜索的位置。超出该点的字符将不被考虑。
51	str.rjust(integer, padstr=' ') 如果 integer 大于 str 的长度，则返回长度为 integer 的新字符串，新字符串以 str 右对齐，并以 padstr 作为填充。否则，返回 str。
52	str.rstrip 返回 str 的副本，移除了尾随的空格。
53	str.rstrip! 从 str 中移除尾随的空格，如果没有变化则返回 nil。
54	str.scan(pattern) [or] str.scan(pattern) { \|match, ko.\| block } 两种形式匹配 pattern（可以是一个正则表达式 Regexp 或一个字符串 String）遍历 str。针对每个匹配，会生成一个结果，结果会添加到结果数组中或传递给 block。如果 pattern 不包含分组，则每个独立的结果由匹配的字符串、$& 组成。如果 pattern 包含分组，每个独立的结果是一个包含每个分组入口的数组。
55	str.slice(fixnum) [or] str.slice(fixnum, fixnum) [or] str.slice(range) [or] str.slice(regexp) [or] str.slice(regexp, fixnum) [or] str.slice(other_str) See str[fixnum], etc. str.slice!(fixnum) [or] str.slice!(fixnum, fixnum) [or] str.slice!(range) [or] str.slice!(regexp) [or] str.slice!(other_str) 从 str 中删除指定的部分，并返回删除的部分。如果值超出范围，参数带有 Fixnum 的形式，将生成一个 IndexError。参数为 range 的形式，将生成一个 RangeError，参数为 Regexp 和 String 的形式，将忽略执行动作。
56	str.split(pattern=$;, [limit]) 基于分隔符，把 str 分成子字符串，并返回这些子字符串的数组。如果pattern是一个字符串 String，那么在分割 str 时，它将作为分隔符使用。如果 pattern 是一个单一的空格，那么 str 是基于空格进行分割，会忽略前导空格和连续空格字符。如果pattern 是一个正则表达式 Regexp，则 str 在 pattern 匹配的地方被分割。当 pattern 匹配一个玲长度的字符串时，str 被分割成单个字符。如果省略了pattern参数，则使用 $; 的值。如果 $; 为 nil（默认的），str 基于空格进行分割，就像是指定了 ` ` 作为分隔符一样。如果省略了limit参数，会抑制尾随的 null 字段。如果 limit 是一个正数，则最多返回该数量的字段（如果 limit 为 1，则返回整个字符串作为数组中的唯一入口）。如果 limit 是一个负数，则返回的字段数量不限制，且不抑制尾随的 null 字段。
57	*str.squeeze([other_str])** 使用为 String#count 描述的程序从 other_str 参数建立一系列字符。返回一个新的字符串，其中集合中出现的相同的字符会被替换为单个字符。如果没有给出参数，则所有相同的字符都被替换为单个字符。
58	*str.squeeze!([other_str])** 与 squeeze 相同，但是 str 会发生变化并返回，如果没有变化则返回 nil。
59	str.strip 返回 str 的副本，移除了前导的空格和尾随的空格。
60	str.strip! 从 str 中移除前导的空格和尾随的空格，如果没有变化则返回 nil。
61	str.sub(pattern, replacement) [or] str.sub(pattern) { \|match\| block } 返回 str 的副本，pattern 的第一次出现会被替换为 replacement 或 block 的值。pattern 通常是一个正则表达式 Regexp；如果是一个字符串 String，则没有正则表达式元字符被解释。
62	str.sub!(pattern, replacement) [or] str.sub!(pattern) { \|match\| block } 执行 String#sub 替换，并返回 str，如果没有替换执行，则返回 nil。
63	str.succ [or] str.next 返回 str 的继承。
64	str.succ! [or] str.next! 相当于 String#succ，但是 str 会发生变化并返回。
65	str.sum(n=16) 返回 str 中字符的 n-bit 校验和，其中 n 是可选的 Fixnum 参数，默认为 16。结果是简单地把 str 中每个字符的二进制值的总和，以 2n - 1 为模。这不是一个特别好的校验和。
66	str.swapcase 返回 str 的副本，所有的大写字母转换为小写字母，所有的小写字母转换为大写字母。
67	str.swapcase! 相当于 String#swapcase，但是 str 会发生变化并返回，如果没有变化则返回 nil。
68	str.to_f 返回把 str 中的前导字符解释为浮点数的结果。超出有效数字的末尾的多余字符会被忽略。如果在 str 的开头没有有效数字，则返回 0.0。该方法不会生成异常。
69	str.to_i(base=10) 返回把 str 中的前导字符解释为整数基数（基数为 2、 8、 10 或 16）的结果。超出有效数字的末尾的多余字符会被忽略。如果在 str 的开头没有有效数字，则返回 0。该方法不会生成异常。
70	str.to_s [or] str.to_str 返回接收的值。
71	str.tr(from_str, to_str) 返回 str 的副本，把 from_str 中的字符替换为 to_str 中相对应的字符。如果 to_str 比 from_str 短，那么它会以最后一个字符进行填充。两个字符串都可以使用 c1.c2 符号表示字符的范围。如果 from_str 以 ^ 开头，则表示除了所列出的字符以外的所有字符。
72	str.tr!(from_str, to_str) 相当于 String#tr，但是 str 会发生变化并返回，如果没有变化则返回 nil。
73	str.tr_s(from_str, to_str) 把 str 按照 String#tr 描述的规则进行处理，然后移除会影响翻译的重复字符。
74	str.tr_s!(from_str, to_str) 相当于 String#tr_s，但是 str 会发生变化并返回，如果没有变化则返回 nil。
75	str.unpack(format) 根据 format 字符串解码 str（可能包含二进制数据），返回被提取的每个值的数组。format 字符由一系列单字符指令组成。每个指令后可以跟着一个数字，表示重复该指令的次数。星号（*）将使用所有剩余的元素。指令 sSiIlL 每个后可能都跟着一个下划线（_），为指定类型使用底层平台的本地尺寸大小，否则使用独立于平台的一致的尺寸大小。format 字符串中的空格会被忽略。
76	str.upcase 返回 str 的副本，所有的小写字母会被替换为大写字母。操作是环境不敏感的，只有字符 a 到 z 会受影响。
77	str.upcase! 改变 str 的内容为大写，如果没有变化则返回 nil。
78	str.upto(other_str) { \|s\| block } 遍历连续值，以 str 开始，以 other_str 结束（包含），轮流传递每个值给 block。String#succ 方法用于生成每个值。

포장을 풀고 명령 문자열

다음 표는 방법 문자열 #이 압축 해제 명령을 풀고 나와 있습니다.

指令	返回	描述
A	String	移除尾随的 null 和空格。
a	String	字符串。
B	String	从每个字符中提取位（首先是最高有效位）。
b	String	从每个字符中提取位（首先是最低有效位）。
C	Fixnum	提取一个字符作为无符号整数。
c	Fixnum	提取一个字符作为整数。
D, d	Float	把 sizeof(double) 长度的字符当作原生的 double。
E	Float	把 sizeof(double) 长度的字符当作 littleendian 字节顺序的 double。
e	Float	把 sizeof(float) 长度的字符当作 littleendian 字节顺序的 float。
F, f	Float	把 sizeof(float) 长度的字符当作原生的 float。
G	Float	把 sizeof(double) 长度的字符当作 network 字节顺序的 double。
g	Float	把 sizeof(float) 长度的字符当作 network 字节顺序的 float。
H	String	从每个字符中提取十六进制（首先是最高有效位）。
h	String	从每个字符中提取十六进制（首先是最低有效位）。
I	Integer	把 sizeof(int) 长度（通过 _ 修改）的连续字符当作原生的 integer。
i	Integer	把 sizeof(int) 长度（通过 _ 修改）的连续字符当作有符号的原生的 integer。
L	Integer	把四个（通过 _ 修改）连续字符当作无符号的原生的 long integer。
l	Integer	把四个（通过 _ 修改）连续字符当作有符号的原生的 long integer。
M	String	引用可打印的。
m	String	Base64 编码。
N	Integer	把四个字符当作 network 字节顺序的无符号的 long。
n	Fixnum	把两个字符当作 network 字节顺序的无符号的 short。
P	String	把 sizeof(char *) 长度的字符当作指针，并从引用的位置返回 \emph{len} 字符。
p	String	把 sizeof(char *) 长度的字符当作一个空结束字符的指针。
Q	Integer	把八个字符当作无符号的 quad word（64 位）。
q	Integer	把八个字符当作有符号的 quad word（64 位）。
S	Fixnum	把两个（如果使用 _ 则不同）连续字符当作 native 字节顺序的无符号的 short。
s	Fixnum	把两个（如果使用 _ 则不同）连续字符当作 native 字节顺序的有符号的 short。
U	Integer	UTF-8 字符，作为无符号整数。
u	String	UU 编码。
V	Fixnum	把四个字符当作 little-endian 字节顺序的无符号的 long。
v	Fixnum	把两个字符当作 little-endian 字节顺序的无符号的 short。
w	Integer	BER 压缩的整数。
X		向后跳过一个字符。
x		向前跳过一个字符。
Z	String	和 * 一起使用，移除尾随的 null 直到第一个 null。
@		跳过 length 参数给定的偏移量。

예

다음 예제를보십시오 다양한 데이터 압축을 풉니 다.

"ABC \ 0 \ 0abc \ 0 \ 0".unpack ( 'A6Z6') # => [ "ABC", "ABC"]
"ABC \ 0 \ 0".unpack ( 'a3a3') # => [ "ABC", "000 \ \ 000"]
"ABC \ 0abc 0 \".unpack ( 'Z의 *의 Z의 *') # => [ "ABC", "ABC"]
"AA".unpack ( 'b8B8') # => [ "10000110", "01100001"]
"AAA".unpack ( 'h2H2c') # => [ "16", "61", 97]
"\ XFE \ XFF \ XFE \ XFF".unpack ( 'SS') # => [-2, 65534]
.unpack ( 'M의 *') # => [ "지금"] "이제 20is를 ="
"전체".unpack ( 'xax2aX2aX1aX2a') # => [ "시간", "E", "L", "L", "오"]

이전 : 루비 모듈 (모듈)

다음 : 루비 배열 (배열)

Ruby 코스

Ruby 고급 자습서

루비 문자열 (문자열)

단일 인용 문자열

두 번 인용 문자열

이스케이프 문자

문자 인코딩

문자열 내장 방법

포장을 풀고 명령 문자열

예

핫 튜토리얼

Contact US