文章内でよく使われる語を抽出


conphic_logo_03
東京都立川市のシステム開発会社 株式会社コンフィック


株式会社コンフィックのブログにアクセスいただき、誠にありがとうございます。

株式会社コンフィックでは、文書(文章)作成支援の各種ツールを開発しています。

文書に含まれている語を抽出することで、その文書を分類する目安とすることができます。
大量の文書データを保有しているが、そのカテゴリが整備できていない場合には、用いられている語で大きく分類することも方法の一つです。

文書内の語の抽出には、形態素解析という技術を用います。
株式会社コンフィックでは、Mecabをよく利用しています。

語を抽出することにより、文書作成時の索引情報として用いることや、使い分け基準を検討する材料になります。
いくつかのサンプル文書をご提示いただければ、形態素解析結果や語の出現度合いをテストすることも可能ですので、お気軽に株式会社コンフィックまでご相談ください。

【関連記事】株式会社コンフィックの「形態素解析」をテーマにしたブログ一覧


システム開発・運用に関してのご相談、ご用命は、多くの開発経験がある株式会社コンフィックへ
e-portfolioeポートフォリオ)、クラウドクラスe-Legislationシステム開発データ変換サービス 等
お気軽にご連絡ください。


株式会社コンフィック 代表取締役 齋藤大地
メールでのご連絡はこちらのフォームからお願いします。
迅速に対応いたします。