data frame 문자열 다루기

Python/tip of python 2020. 7. 16. 20:24

[엑셀에서 우선 읽어오자]

df = pd.read_excel('화일이름.xlsx', index_col='기준이 될 컬럼 이름')

[슬라이싱으로 읽어오기]

df['곡명'].str[0] #맨 앞글자

df['곡명'].str[:10] #앞에서 10자까지

[단어별로 문자열 쪼개기]

df['곡명'].str.split() #곡명 별 문자열에서 단어별 시리즈 생성

df['곡명'].str.split(expand=True) # 단어별 순서데로 0 1 2 ~ 컬럼생성

df['곡명'].str.split(expand=True)[1] # 두 번째 단어만 선택

[좌우 스페이스(white space) 문자열 삭제]

df['곡명'] = df['곡명'].str.strip() ######## 스페이스 삭제 후 재 저장

왼 쪽 스페이스 없애기 : lstrip

오른쪽은 rstrip

오른쪽 끝에 특정 문자 삭제 rstrip('!') # 오른쪽에 ! 삭제

[특정 문자로 시작하는 것 찾기]

cc = df['가수'].str.startswith('정')

df[cc] # 정으로 시작하는 결과물만을 data frame으로 보기

끝나는 것 찾기 : endswith

포함된 것 : contains

포함된 것 세기 : counts # 숫자를 결과물로 줌

[문자열 교체]

df['가수'].str.replace('정', '사랑') # 정을 사랑으로 모두 변경, ''을 쓰면 정 삭제

[함수 적용]

def fn(va):

return len(va)

df['곡명'].str.apply(fn) # 곡명의 글자수를 dataframe으로 지정

xlwings 라이브러리에서 좌표로 내용 입력하는 함수 (0)	2020.08.19
python - 빠진 자리 data (missingno) (0)	2020.07.20
installing libraries on conda (0)	2020.07.20
python - tip : 원하는 조건의 값을 받아내기 전까지 반복 (0)	2020.07.13
a, b값 바꿔치기(상호 교환) (0)	2020.07.13

Stony on Going Stony on Going