-
data frame 문자열 다루기Python/tip of python 2020. 7. 16. 20:24
[엑셀에서 우선 읽어오자]
df = pd.read_excel('화일이름.xlsx', index_col='기준이 될 컬럼 이름')
[슬라이싱으로 읽어오기]
df['곡명'].str[0] #맨 앞글자
df['곡명'].str[:10] #앞에서 10자까지
[단어별로 문자열 쪼개기]
df['곡명'].str.split() #곡명 별 문자열에서 단어별 시리즈 생성
df['곡명'].str.split(expand=True) # 단어별 순서데로 0 1 2 ~ 컬럼생성
df['곡명'].str.split(expand=True)[1] # 두 번째 단어만 선택
[좌우 스페이스(white space) 문자열 삭제]
df['곡명'] = df['곡명'].str.strip() ######## 스페이스 삭제 후 재 저장
왼 쪽 스페이스 없애기 : lstrip
오른쪽은 rstrip
오른쪽 끝에 특정 문자 삭제 rstrip('!') # 오른쪽에 ! 삭제
[특정 문자로 시작하는 것 찾기]
cc = df['가수'].str.startswith('정')
df[cc] # 정으로 시작하는 결과물만을 data frame으로 보기
끝나는 것 찾기 : endswith
포함된 것 : contains
포함된 것 세기 : counts # 숫자를 결과물로 줌
[문자열 교체]
df['가수'].str.replace('정', '사랑') # 정을 사랑으로 모두 변경, ''을 쓰면 정 삭제
[함수 적용]
def fn(va):
return len(va)
df['곡명'].str.apply(fn) # 곡명의 글자수를 dataframe으로 지정
'Python > tip of python' 카테고리의 다른 글
xlwings 라이브러리에서 좌표로 내용 입력하는 함수 (0) 2020.08.19 python - 빠진 자리 data (missingno) (0) 2020.07.20 installing libraries on conda (0) 2020.07.20 python - tip : 원하는 조건의 값을 받아내기 전까지 반복 (0) 2020.07.13 a, b값 바꿔치기(상호 교환) (0) 2020.07.13