您现在的位置是:乐刷收款呗POS机 > 电签POS机

pos机专业词,「火炉炼AI」机器学习036

乐刷收款呗POS机2025-04-25 09:29:05【电签POS机】1人已围观

简介网上有很多关于pos机专业词,「火炉炼AI」机器学习036的知识,也有很多人为大家解答关于pos机专业词的问题,今天乐刷官方代理商(b06.cn)为大家整理了关于这方面的知识,让我们一

【温馨提示】如果您有办理pos机的需求或者疑问,可以联系官方微信 18127011016

POS机办理

网上有很多关于pos机专业词,「火炉炼AI」机器学习036的机机器知识,也有很多人为大家解答关于pos机专业词的专业问题,今天乐刷官方代理商(www.zypos.cn)为大家整理了关于这方面的词火知识,让我们一起来看下吧!

本文目录一览:

1、炉炼pos机专业词

pos机专业词,「火炉炼AI」机器学习036

pos机专业词

【火炉炼AI】机器学习036-NLP词形还原

【火炉炼AI】机器学习036-NLP词形还原

pos机专业词,「火炉炼AI」机器学习036

(本文所使用的学习Python库和版本号: Python 3.6, Numpy 1.14, scikit-learn 0.19, matplotlib 2.2, NLTK 3.3)

词形还原也是机机器将单词转换为原来的相貌,和上一篇文章中介绍的专业词干提取不一样,词形还原要难的词火多,它是炉炼一个更加结构化的方法,在上一篇中的学习词干提取例子中,可以看到将wolves提取为wolv等,机机器这些肯定不是专业我们所期望的。那么此处我们使用NLP词形还原的词火方式来将英语单词还原。

1. NLP词形还原

词形还原是炉炼基于字典的映射,而且,学习NLTK还要求手动注明词形,否则可能会还原不准确,所以在做自然语言处理的过程中,先对文本进行分词,然后标注词性,最后再进行词形还原。

# 待还原的单词words = [\'table\', \'probably\', \'wolves\', \'playing\', \'is\', \'dog\', \'the\', \'beaches\', \'grounded\', \'dreamt\', \'envision\']# 由于词形还原需要先标注词性,故而此处我们用名词和动词两种词性进行测试lemmatizers = [\'NOUN LEMMATIZER\', \'VERB LEMMATIZER\'] # 两种词性lemmatizer = wordNetLemmatizer()formatted_row = \'{:>24}\' * (len(lemmatizers) + 1) # 使其打印格式一致print(formatted_row.format(\'WORD\',*lemmatizers)) # 打印表头for word in words: # # 每个单词逐一变换 lemmatized=[lemmatizer.lemmatize(word, pos=\'n\'), lemmatizer.lemmatize(word, pos=\'v\')] # 注意里面pos表示词性,分别表示名称和动词 print(formatted_row.format(word,*lemmatized)) # 对提取后的stem进行拆包复制代码

---------------------------输---------出--------------------------------

WORD NOUN LEMMATIZER VERB LEMMATIZER table table table probably probably probably wolves wolf wolves playing playing play is is be dog dog dog the the the beaches beach beach grounded grounded ground dreamt dreamt dream envision envision envision复制代码

------------------------------完-------------------------------------

可以看出,虽然WordNetLemmatizer很有用,但是需要事先判断词性,并且把词性作为一个参数传入到这个函数中,那么有没有可能自动判断词性,不需要我们认为判断了?这是肯定的,NLTK有一个函数pos_tag可以自动判断出某个单词的词性,所以基于此,我们可以编写一个函数,来自动处理一整个句子,输出器词性还原之后的形式。如下代码:

# 定义一个函数来对一个句子中的所有单词进行词形还原def lemmatize_all(sentence): wnl = WordNetLemmatizer() for word, tag in pos_tag(word_tokenize(sentence)): if tag.startswith(\'NN\'): yield wnl.lemmatize(word, pos=\'n\') elif tag.startswith(\'VB\'): yield wnl.lemmatize(word, pos=\'v\') elif tag.startswith(\'JJ\'): yield wnl.lemmatize(word, pos=\'a\') elif tag.startswith(\'R\'): yield wnl.lemmatize(word, pos=\'r\') else: yield word复制代码text =\'dog runs, cats drunk wines, chicken eat apples, foxes jumped two meters\'print(\'/\'.join(lemmatize_all(text)))复制代码

---------------------------输---------出--------------------------------

dog/run/,/cat/drink/wine/,/chicken/eat/apple/,/fox/jump/two/meter

---------------------------------完-------------------------------------

可以看出,句子中的名词复数都转变为了单数,动词过去式都转变为了现在式等。

关于pos_tag()函数,返回的是单词和词性标签,这些词性标签有:

# NLTK 词性标签: CC 连词 and, or,but, if, while,althoughCD 数词 twenty-four, fourth, 1991,14:24DT 限定词 the, a, some, most,every, noEX 存在量词 there, there\'sFW 外来词 dolce, ersatz, esprit, quo,maitreIN 介词连词 on, of,at, with,by,into, underJJ 形容词 new,good, high, special, big, localJJR 比较级词语 bleaker braver breezier briefer brighter briskerJJS 最高级词语 calmest cheapest choicest classiest cleanest clearestLS 标记 A A. B B. C C. D E F First G H I J KMD 情态动词 can cannot could couldn\'tNN 名词 year,home, costs, time, educationNNS 名词复数 undergraduates scotchesNNP 专有名词 Alison,Africa,April,WashingtonNNPS 专有名词复数 Americans Americas Amharas AmityvillesPDT 前限定词 all both half manyPOS 所有格标记 \' \'sPRP 人称代词 hers herself him himself hisselfPRP$ 所有格 her his mine my our oursRB 副词 occasionally unabatingly maddeninglyRBR 副词比较级 further gloomier granderRBS 副词最高级 best biggest bluntest earliestRP 虚词 aboard about across along apartSYM 符号 % & \' \'\' \'\'. ) )TO 词to toUH 感叹词 Goodbye Goody Gosh WowVB 动词 ask assemble assessVBD 动词过去式 dipped pleaded swipedVBG 动词现在分词 telegraphing stirring focusingVBN 动词过去分词 multihulled dilapidated aerosolizedVBP 动词现在式非第三人称时态 predominate wrap resort sueVBZ 动词现在式第三人称时态 bases reconstructs marksWDT Wh限定词 who,which,when,what,where,howWP WH代词 that what whateverWP$ WH代词所有格 whoseWRB WH副词复制代码

########################小

很赞哦!(44)