(수업내용 : 단어로 분리하기
- 텍스트 파일에서 단어를 읽어야 한다면 어떻게 할 것인가? 예를 들어서 속담이 저장된 파일에서 단어를 분리하
여 리스트로 만들고 싶다고 하자.
이 때 사용할 수 있는 것이 split() 메소드이다.문자열 객체의 split() 메소드는 공백문자를 이용하여 문자열에서 단
어들을 분리한다.
infile = open("proverbs.txt", "r")
for line in infile:
line = line.rstrip() # 오른쪽 공백문자 제거
word_list = line.split() # 단어들 분리
for word in word_list: # 리스트에 들어 있는 단어 출력
print(word)
infile.close()
출력결과
All's
well
...
flock
together.
) 단어로 분리하기
- 만약 텍스트를 단어로 분리한 후에, 단어에 들어 있는 모든 문장 부호들을 제거하고 싶으면 아래와 같이 호출하
면 된다.
파일 전체 읽기
- 우리는 텍스트가 들어있는 파일을 한 번에 다 읽을 수도 있다. read()를 호출하면 파일의 모든 문자가 하나의 거
대한 문자열로 반환된다.
- 다만 파일이 무척 크다면 이들 방법은 많은 양의 메모리를 필요로 하므로 좋은 방법은 아니다.
- readlines() 메소드를 사용하는 것이다. readlines()는 각 줄이 저장된 리스트를 반환한다) 6) 문자 인
코딩
- 아래와 같이 인
코딩을 처리하면 된다.
infile = open("input.txt", "r", encoding="utf-8")
여러분이 외국과 텍스트 파일을 교환할 때는 항상 UTF-8로 인
코딩하는 것이 좋다. 거의 요즘은 UTF-8이 주류를 이루고
있다.
7) CSV(Comma-Seperated Values) 파일 처리
- CSV는 테이블 형식의 데이터를 저장하고 이동하는데 사용되는 구조화된 텍스트 파일 형식이다. CSV는 Microsoft Excel
과 같은 스프레드시트에 적합한 형식이다. 공공기관에서 제공하는 데이터는 CSV 형식의 데이터 세트가 많다.
파이썬 모듈 csv는 CSV reader와 CSV writer를 제공한다. 예를 들어서 d:드라이브에 서울의 기상 정보가 저장된 “weather.
csv”라는 파일이 있다고 하자. 다음과 같은 코드로 CSV 파일을 읽을 수 있다. 다음 슬라이드에서 보자.
import csv # CSV 모듈을 불러온다.
f = open('d://weather.csv’) # CSV 파일을 열어서 f에 저장한다.
data = csv.reader(f) # reader() 함수를 이용하여 읽는다.
header = next(data) # 헤더를 제거한다.
for row in data: # 반복 루프를 사용하여 데이터를 읽는다.
print(row)
f.close()
출력결과
['1980-04-01', '108', '6.5', '3.2', '11.7']
['1980-04-02', '108', '6.5', '1.4', '12.9']
['1980-04-03', '108', '11.1', '4.1', '18.4']
['1980-84-84', '108', '15.5', '8.6', '21’] 좋은 강의 정말 잘 들었습니다. 자세하고 친절한 강의를 항상 듣는 저는 행운인것 같습니다. 앞으로도 계속해서 좋은 강의 부탁드립니다. 항상 저도 강사님의 열의에 감사하며 열심히 공부하겠습니다. 감사합니다 .오늘도 수고 많으셨습니다.^&^&