ファイル拡張子をループする、非ASCII文字を探す – Python

私は非ASCII文字を含むファイルのディレクトリ(とそのサブディレクトリ)を見ている小さなPythonプログラムを書いていました。

私はそれを改善したい。この「ディレクトリ」内の特定のファイルは、非ASCII文字を持つことがサポートされているZIP、DTA/OUT、OMX、SFD/SF3などのファイルであることがわかります。だから私はこれらがあることを知り、ASCII文字を含んではならないものをスクリーニングします。なぜなら私の最終的な目的は、非ASCII文字を含んでいてはならないファイルを見つけて削除することです(TB値重要なデータの)。

私の考えは、次のようなPythonのtry/exceptブロックの
“except”部分にあるファイルをさらに調べることです:

try:
    content.encode('ascii')
    output.write(str(counter) + ", " + file + ", ASCIIn")
    print str(counter) + " ASCII file status logged successfully: " + file
    counter += 1 

except UnicodeDecodeError:
    output.write(str(counter) + ", " + file + ", non-ASCIIn")
    print str(counter) + " non-ASCII file status logged successfully: " + file
    counter += 1 

私がコードを書くとき、ファイルが '.zip''sfd'
/code>などは、厄介なプログラムとなり、永遠に続くでしょう。

1つずつのファイル拡張子のグループを検索する方法はありますか?おそらく、これらの拡張子を含むファイルがありますか?それとも私が考えなかったこと?これが愚かな質問であれば私の謝罪を前もって謝っていますが、Pythonにはたくさんのクールな機能があり、私は何かを逃していると確信しています。

乾杯。

ベストアンサー

私は何か答えがないので、私は先に進み、部分的な答えでこれに自分自身を答えることができます。私は基本的には別のアプローチを取って、この共有のために豊富であると予想される特定のファイルを探して、各ファイルに対して同じことを行います。それは一種のハッキーですが、それはj
obを行うでしょう。

コメントする

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です