문자열 중간에 어떤 변수의 내용을 출력하고 싶다면 print()함수를 이용하면 된다.


>>> a=3+4j
>>> b=’hi’
>>> print('a is',a,’and b is’,b) #변수 앞뒤에 공백문자를 자동으로 넣어준다.
a is (3+4j) and b is hi


또는 변수의 내용으로 아예 치환한 문자열을 만들고 싶다면 str() 내장함수를 이용하는 방법도 있다.


>>> a=3+4j
>>> b=’hi’
>>> ‘a is ‘+str(a)+’ b is ‘+ b
a is (3+4j) and b is hi


더 간단하고 일반적인 방법은 문자열 포맷팅 기능을 이용하는 것이다.  C 언어에서 printf() 문을 이용하여 변수의 내용을 출력하는 유사한 방법을 파이썬에서도 지원한다. 이것을 문자열의  formatting이라고 하는데 예를 들어서 정수값을 출력하고 싶다면 다음과 같이 하면 된다.


>>> a=11
>>> “a equals %d.”%a


이와 같이 문자열 내부의 %d는 문자열에 바로 뒤따르는 ‘%변수’의 변수값으로 바꾸어 준다. 두 개 이상을 출력하려면 다음과 같이 괄호로 묶어주면 된다. (괄호로 묶인 자료 집합을 튜플이라고 하며 뒤에서 자세하게 설명할 것이다.)


>>> a=11
>>> b=-22
>>> "vars are %d and %d."%(a,b)
'vars are 11 and -22.'


실수를 출력하려면 %f, 문자열을 출력하려면 %s를 사용하면 된다.


[표 1] 문자열 formatter 의 종류

문자열 포맷팅

기능

%d, %x, %o

십진수, 16진수, 8진수(복소수는 출력이 안 됨)

%f

%.숫자f

실수를 출력 (복소수는 출력이 안 됨.)

표시할 소수점 아래 자리수를 명시한다.

%s

문자열 출력

%%

‘%’ 문자 자체를 출력


문자열을 출력하는 예를 들어보면 다음과 같다.


>>> ss = 'short'   
>>> print('Life is %s.'%ss)
Life is short.


아래 예와 같이 실수의 경우 표시할 소수점 아래 자리수를 지정해줄 수 있다.


>>> rn = 1.2345678  
>>> 'f is about %.4f'%rn
'f is about 1.2346'


소수점 다섯째 자리에서 반올림하여 소수점 넷째 자리까지 표시했음을 알 수 있다.


 한 가지 짚고 넘어갈 것은 %d와 %f 는 복소수는 출력하지 못한다. 복소수는 %s를 이용하여 출력하면 된다.


>>> c1=11+22.3j
>>> print('c1=%s'%c1)
c1=(11+22.3j)


재미있는 것은 %s를 이용하면 숫자나 문자열을 가리지 않고 모두 출력해준다는 것이다. 이는 숫자도 내부적으로 자동으로 문자열로 변환되기 때문이다.


>>> n=1024
>>> print('n equals %s.'%n)
n equals 1024.


따라서 숫자를 출력하든 문자를 출력하든 %s를 사용하여도 전혀 문제가 없다.



Posted by 살레시오
,

 파이썬에서는 문자열끼리 더하거나 곱할 수 있다. 문자열끼리 연결하는데  덧셈 연산자를 사용하는 것은 다른 언어에서도 흔하지만 곱셈은 독특하다.  두 개의 문자열을 더하면 문자열이 하나로 합해진 새로운 문자열이 만들어진다.


>>> “My name is “+”Salesio.”
>>> q = “ipython”
>>> r = “ is useful.”
>>> s = q+r


이 예제에서 원래의 문자열 q와 r은 더하기 연산으로 변경되지 않는다. 앞에서도 밝혔듯이 문자열은 한 번 내용이 정해지면 그 다음에는 변경할 수 없다. (이러한 자료형을 immutable 자료형이라고 한다.)  다만 연산의 결과로 새로운 문자열이 생성되는 것이다.  만약


>>>s = ’Life is long.’


에서 long이라는 단어를 short로 바꾸고 싶다면 슬라이싱을 이용해서 다음과 같이 할 수 있다.


>>> s = s[:8] + ’short.’


이 경우 원래 문자열이 바뀌는 것이 아니라 기존의 문자열은 모두 삭제되고 새로 생성된 문자열이 다시 변수 s에 저장되는 것이다. (사실 변수 s 는 문자열에 대한 참조가 저장된다. 이 경우 참조, 즉 주소가 새로 생성된 문자열의 그것으로 바뀌는 것이다.)


 유사하게 문자열에 정수를 곱하면 정수만큼 반복되는 새로운 문자열을 생성한다.


>>> “blah “*5

blah blah blah blah blah

>>> ‘=’*50

==================================================


위에서 두 번째 예는 화면에 출력할 때 간단히 구분선을 만드는 용도로 사용된다.



Posted by 살레시오
,

 파이썬3의 문자열은 내부적으로 (유니코드) 문자의 배열로 취급된다. 예를 들어보자.


>>> s=“Hello World”


문자열

H

e

l

l

o


w

o

r

l

d

인덱스 (기본 방향)

0

1

2

3

4

5

6

7

8

9

10

인덱스 (역방향)

-11




-7

-6

-5

-4

-3

-2

-1


문자열에 포함된 각각의 문자에 매겨진 이 번호를 인덱스(index)라고 한다. 이 예에서 문자열의 길이는 11이고  인덱스는 0부터 시작한다. 인덱스가 1부터 시작하지 않고 0부터 시작함에 주의해야 한다. (다른 프로그래밍 언어에서도 배열의 인덱싱은 보통 0부터 시작한다.)


>>> s[0]

H

>>> s[6]

w

>>> s[-1]

d


마지막의 s[-1]과 같이 음수는 뒤에서부터 세는 것이다. 따라서 뒤에서 첫 번째 문자인 ‘d’가 된다.


>>> s[-2]

l

>>> s[-6]


만일


>>>  a=”python is the best.”


라는 문자열에서 첫 단어를 뽑아내고 싶다면 아래와 같이 한다.


>>> b=a[0:6]


인덱스 ‘0:6’ 이 뜻하는 것은 ‘0부터 5까지’ 이다. 끝 번호 6은 포함하지 않는다는 것에 주의해야 한다. 이렇게 콜론(:)을 이용하여 연속적인 인덱스를 지정하는 것을 슬라이싱(slicing)이라고 한다. 문자열의 마지막까지 지정하려면 끝 번호를 생략하면 된다.


>>> c = a[7:] # ‘is the best.’ 가 c에 저장된다.


반대로 시작 번호가 생략되면 문자열의 처음부터 선택된다.


>>> d = a[:8] # ‘python is’ 가 d에 저장된다.


그리고 시작 번호와 끝 번호가 모두 생략된다면, 즉 e=a[:] 이라고 하면 문자열 전체가 선택이 된다. 즉, e에는 a 문자열 전체가 저장된다.


슬라이싱에서도 인덱싱과 마찬가지로 음수를 사용할 수 있다.


>>> f = a[:-5]


결과를 확인해 보기 바란다. 이 경우에도 끝 번호는 포함되지 않으므로 첫 문자부터 -6번 문자까지 뽑아져서 f에 저장된다. 슬라이싱을 정리하면 다음과 같다.


  • s[m:n] 은 s[m] 부터 s[n-1] 까지의 부분 문자열이다.


예를 들어서 만약 문자열 h를 5번째 문자를 기준으로 둘로 나눠서 hl, hr에 정하고 싶다면 다음과 같이 하면 될 것이다.


>>> hl = h[:5]
>>> hr = h[5:]


이러한 기능을 이용해서 문자열 자체를 바꿀 수는 없다는 것에 주의하자. 즉, 다음과 같이 문자열의 일부분을 바꾸는 것은 불가능한다.


>>>a[0] = ’x’ #불가능하다


이는 문자열은 한 번 내용이 정해지면 내용을 읽는 수는 있지만 변경될 수는 없는 자료형이기 때문이다. (이러한 자료형을 immutable 하다고 한다.)




Posted by 살레시오
,

 파이썬에서 문자열은 큰따옴표(“...”) 혹은 작은 따옴표 (‘...’)로 묶인 문자들의 집합이다.


“Hello world.”
‘Mokpo National Univ.’
“12.3”


위의 예는 모두 문자열을 나타낸다. 12.3은 숫자이고 이것을 따옴표로 묶은 “12.3”은 문자열이다. 즉, 문자’1’, 문자’2’, 문자’.’, 문자’3’ 의 배열(array)이다. 파이썬에서 문자형이라는 자료형은 별도로 없다. 다른 언어(C/C++, JAVA, C# 등)에서는 보통 작은 따옴표는 한 문자를 표현할 때 사용되지만 파이썬에서는 문자열을 입력할 때 사용한다는 것에 유의하자.


 문자열을 입력하는 방법을 왜 두 가지로 마련해 놓았을까? 작은 따옴표가 포함된 문자열 혹은 큰따옴표가 포함된 문자열을 쉽게 입력할 수 있기 때문이다.


‘He said “hi”. ’
“I’m your father.”


 파이썬 문자열에도 C언어의 printf()함수에서 사용하였던 특수 문자를 사용할 수 있다. 특수문자는 역슬래시(\ 는 여기서는 escape cahracter 라고 한다.)로 시작하며 특수한 용도로 사용된다. 다음 표에 주로 쓰이는 특수 문자를 정리하였다.


[표 1 ] 파이썬의 문자열에 쓰이는 특수문자

문자

설명

\n

줄바꿈

\t

수평 탭(tab)

\\

‘\’문자 자체를 의미

\’

작은따옴표 문자

\”

큰따옴표 문자


예를 들면 다음과 같다.


“He sais \”How are you?\””
“Hi.\nHello.”
‘He\’s finished.’


단 문자열의 중간에 줄바꿈 기호 ‘\n’이 들어가면 가독성이 떨어지므로 파이썬에서는 줄바꿈 기호를 타이핑하지 않고 그대로 입력할 수 있는 방법으로 “”” ... “”” 과 ‘’’ … ’’’ 를 제공한다.


>>> s = “””HI
Hello”””


라고 입력하고 그 결과를 확인해 보자.


>>> s


문자열 s에는 사용자가 엔터키로 입력한 줄바꿈 기호가 ‘\n’으로 자동으로 치환되었음을 알 수 있다.


만약 문자열 안의 ‘\’ 문자를 이스케이프 문자로 간주하지 않고 단순 문자로 사용하고 싶다면 ‘\\’와 같이 입력해도 되지만 한 문자열 안에 이런 경우가 많이 발생한다면 문자열 앞에 r을 붙이면 된다. 문자열 앞에 r이 붙으면 그 문자열 안의 모든 ‘\’는 단순 문자로 처리되며 결과 문자열에서는 ‘\’문자가 자동으로 ‘\\’로 변환된다.


>>> r'Hi.\nMy name:\tjhp'
'Hi.\\nMy name:\\tjhp'


이 방법은 특히 정규식(regular express)을 다룰 때 유용하다.



Posted by 살레시오
,