MySQLで大量のテキストを保存するのに最もスペース効率の良い方法は何ですか?

私はPythonでMySQLデータベースに大きなページセットのHTMLコードを格納するWebクローラーを作成しています。データの処理を開始する前に、私の記憶と処理の方法が最適かどうかを確認したいと思います。私はしたいと思います:

  • データベースで使用されるストレージスペースを最小限に抑えます。HTMLコード、ハフマンエンコーディング、その他の形式の圧縮を最小限に抑えることができます。フィールドをフルテキストで検索する可能性を維持したいと思います。ハフマンエンコーディングのような圧縮アルゴリズムがこれを可能にするかどうかはわかりません。

  • 大量の行をエンコードして保存するために必要なプロセッサの使用量を最小限に抑えます。

誰かこの似たような問題について何か提案や経験がありますか?
Pythonはこれを行うには最適な言語ですか、それが何らかのHTTP要求と正規表現に加えて最適な圧縮を必要としていることを考えると、

ベストアンサー

HTMLがHTMLに対して不透明であることに気付かない場合は、 COMPRESS 関数を使用してデータを保存し、

コメントする

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です