二維碼
        企資網(wǎng)

        掃一掃關(guān)注

        當(dāng)前位置: 首頁(yè) » 企業(yè)資訊 » 熱點(diǎn) » 正文

        盤(pán)點(diǎn)一個(gè)英文文本中統(tǒng)計(jì)關(guān)鍵詞的方法

        放大字體  縮小字體 發(fā)布日期:2022-12-07 18:08:24    作者:微生翼虎    瀏覽次數(shù):69
        導(dǎo)讀

        大家好,我是皮皮。一、前言前幾天在Python最強(qiáng)王者交流群【W(wǎng)endy Zheng】問(wèn)了一個(gè)英文文本中統(tǒng)計(jì)關(guān)鍵詞得問(wèn)題,這里拿出來(lái)給大家分享下。二、實(shí)現(xiàn)過(guò)程針對(duì)這個(gè)問(wèn)題,感謝給出一個(gè)思路方法,也許有幫助,首先我們需

        大家好,我是皮皮。

        一、前言

        前幾天在Python最強(qiáng)王者交流群【W(wǎng)endy Zheng】問(wèn)了一個(gè)英文文本中統(tǒng)計(jì)關(guān)鍵詞得問(wèn)題,這里拿出來(lái)給大家分享下。

        二、實(shí)現(xiàn)過(guò)程

        針對(duì)這個(gè)問(wèn)題,感謝給出一個(gè)思路方法,也許有幫助,首先我們需要將Excel中得文本進(jìn)行導(dǎo)入到一個(gè)文感謝件中去,代碼如下:

        # coding: utf-8import pandas as pddf = pd.read_excel('./文本.xlsx')# print(df.head())# df['可以關(guān)鍵詞']for text in df['工作要求']: # print(text) if text is not None: with open('工作要求.txt', mode='a', encoding='utf-8') as file: file.write(str(text))print('寫(xiě)入完成')

        接下來(lái)就可以針對(duì)這個(gè)文感謝件進(jìn)行相關(guān)得詞頻統(tǒng)計(jì)了,如果你有自己自定義得關(guān)鍵詞,也可以就著關(guān)鍵詞去統(tǒng)計(jì),沒(méi)有得話,就自己在關(guān)鍵詞范圍內(nèi),任意取多少個(gè)關(guān)鍵詞都可以,相關(guān)得代碼如下所示:

        from collections import Counterimport pandas as pddf = pd.read_excel('./文本.xlsx')# print(df.head())words = []with open('工作要求.txt', 'r', encoding='utf-8') as f: line = f.readlines() for word in line[0].split(' '): words.append(word)print(len(words))counter = Counter(words)# print(counter)# df['可以關(guān)鍵詞']for text in df['可以關(guān)鍵詞']: for k, v in counter.items(): if k == text: print(k, v)

        這個(gè)代碼對(duì)于英文文本還是適用得,不過(guò)有個(gè)小問(wèn)題,如下。

        最后這里也給出中文分詞得代碼和可視化代碼,兩者結(jié)合在一起得,感興趣得小伙伴們可以試試看。

        from collections import Counter # 統(tǒng)計(jì)詞頻from pyecharts.charts import Barfrom pyecharts import options as optsfrom snownlp import SnowNLPimport jieba # 分詞with open('text_分詞后_outputs.txt', 'r',encoding='utf-8') as f: read = f.read()with open('stop_word.txt', 'r', encoding='utf-8') as f: stop_word = f.read()word = jieba.cut(read)words = []for i in list(word): if i not in stop_word: words.append(i)columns = []data = []for k, v in dict(Counter(words).most_common(10)).items(): columns.append(k) data.append(v)bar = ( Bar() .add_xaxis(columns) .add_yaxis("詞頻", data) .set_global_opts(title_opts=opts.TitleOpts(title="詞頻top10")) )bar.render("詞頻.html")三、總結(jié)

        大家好,我是皮皮。這篇文章主要盤(pán)點(diǎn)了一個(gè)英文文本中統(tǒng)計(jì)關(guān)鍵詞方法處理得問(wèn)題,文中針對(duì)該問(wèn)題,給出了具體得解析和代碼實(shí)現(xiàn),幫助粉絲順利解決了問(wèn)題。

        最后感謝粉絲【W(wǎng)endy Zheng】提問(wèn),感謝【Python進(jìn)階者】給出得思路和代碼解析,感謝【Python狗】等人參與學(xué)習(xí)交流。

         
        (文/微生翼虎)
        免責(zé)聲明
        本文僅代表作發(fā)布者:微生翼虎個(gè)人觀點(diǎn),本站未對(duì)其內(nèi)容進(jìn)行核實(shí),請(qǐng)讀者僅做參考,如若文中涉及有違公德、觸犯法律的內(nèi)容,一經(jīng)發(fā)現(xiàn),立即刪除,需自行承擔(dān)相應(yīng)責(zé)任。涉及到版權(quán)或其他問(wèn)題,請(qǐng)及時(shí)聯(lián)系我們刪除處理郵件:weilaitui@qq.com。
         

        Copyright ? 2016 - 2025 - 企資網(wǎng) 48903.COM All Rights Reserved 粵公網(wǎng)安備 44030702000589號(hào)

        粵ICP備16078936號(hào)

        微信

        關(guān)注
        微信

        微信二維碼

        WAP二維碼

        客服

        聯(lián)系
        客服

        聯(lián)系客服:

        在線QQ: 303377504

        客服電話: 020-82301567

        E_mail郵箱: weilaitui@qq.com

        微信公眾號(hào): weishitui

        客服001 客服002 客服003

        工作時(shí)間:

        周一至周五: 09:00 - 18:00

        反饋

        用戶
        反饋

        亚洲真人无码永久在线| 99精品人妻无码专区在线视频区| 久久青青草原亚洲av无码app| 最近2018中文字幕免费视频| 国产啪亚洲国产精品无码| 亚洲日韩精品无码一区二区三区| 日本免费中文字幕| 亚洲一区无码精品色| h无码动漫在线观看| 无码人妻精品一区二区三区久久| 中文字幕亚洲综合久久菠萝蜜| 亚洲精品乱码久久久久久中文字幕| 国产99久久九九精品无码| 国产在线无码视频一区二区三区| 成人午夜精品无码区久久| 亚洲精品无码AV中文字幕电影网站 | 色多多国产中文字幕在线| 亚洲VA中文字幕无码一二三区| 免费无遮挡无码视频在线观看 | AV无码免费永久在线观看| 色窝窝无码一区二区三区色欲| 在线a亚洲v天堂网2019无码| 中文字幕一区二区三区乱码| 日韩视频中文字幕精品偷拍| 日本在线中文字幕第一视频| 国产中文在线亚洲精品官网| 2022中文字幕在线| 亚洲激情中文字幕| 最近更新中文字幕在线| 最近免费字幕中文大全视频| 久草中文在线观看| 中文字幕无码久久久| 久久无码国产专区精品| 无码夫の前で人妻を侵犯| 亚洲中文字幕无码中文字在线| 亚洲综合无码精品一区二区三区| 精品无人区无码乱码毛片国产| 制服中文字幕一区二区| 亚洲av午夜国产精品无码中文字| 最近免费中文字幕高清大全| 中文字幕日韩第十页在线观看 |