01-自然语言处理基础知识与操作
第一章自然语言处理基础
概述
en_str = ' hello world, hello, my name is HanXiaoyang! '
res = en_str.strip().lstrip().rstrip()
print(res)
res = en_str.replace('hello', 'hi')
print(res)
zh_str = ' 大家好,我叫陆超 '
res = zh_str.strip().lstrip().rstrip()
print(res)
res = zh_str.strip().replace('陆超', '寒小阳')
print(res)
res = zh_str.strip().replace('大家好,', '')
print(res)
my_str = '大家好,我是李雪琴,我在北京大学,你吃饭没呢?'
res = my_str[0:3]
print(res)
res = my_str[4:4 + 5]
print(res)
res = my_str[-1 - 5:-1]
print(res)
res = my_str[::2]
print(res)
res = my_str[::-1]
print(res)
str1 = '大家好,我是陆超,真好!'
str2 = '大家好,我是李雪琴,你吃饭没呢?'
print(str1 + str2)
strs = ['我是陆超', '我是李雪琴', '我是xxx,好high哟,感觉人生已经达到了高潮,感觉人生已经达到了巅峰']
res = ';'.join(strs)
print(res)
tmp_str = '我是陆超;我是李雪琴;我是xxx,好high哟,感觉人生已经达到了高潮,感觉人生已经达到了巅峰'
print(tmp_str.split(';'))
en_strs = ['ABc', 'aCd', 'CdE', 'xYz']
print(sorted(en_strs))
def sort_fun(x):
return x[1].lower()
print(sorted(en_strs, key=sort_fun))
print(sorted(en_strs, key=lambda x: x[2].lower()))
zh_str = '我是陆超;我是李雪琴;我是毛毛姐,好high哟,感觉人生已经达到了高潮,感觉人生已经达到了巅峰'
print(zh_str.index('陆超'))
print(zh_str.index('毛毛姐'))
print(zh_str.find('毛毛姐'))
print(zh_str.find('来了老弟'))
en_str = 'hello, my name is Patrick'
print(en_str.lower())
print(en_str.upper())
print(en_str.capitalize())
help(str)