名詞のリストで複数形を削除するにはどうすればよいですか?

私は文字列のリストを持っています:

['bill', 'simpsons', 'cosbys', 'cosby','bills','mango', 'mangoes']

このリストからすべての複数形を削除するにはどうすればよいですか? だから、私は出力をしたい:

['bill', 'simpsons', 'cosby','mango']
ベストアンサー

一般に、このプロセスは「ステミング」と呼ばれ、Pythonには「ステミング」と呼ばれるパッケージがあります。

そう使いました:

from stemming.porter2 import stem
stem("simpsons")

Stemming does more than just stem plurals, but you could modify
the stemming package to only perform the plural stemming. Take a
look at the source: http://tartarus.org/martin/PorterStemmer/python.txt

コメントする

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です