東京都立川市のシステム開発会社 株式会社コンフィック 当社ブログにアクセスいただき、 誠にありがとうございます。 文章を翻訳する際には、日本語1文に対して訳文1文としておくと、対訳データとして活用することが可能です。 翻 … 続きを読む 対訳データ
カテゴリー: データ変換
データの類似度比較
東京都立川市のシステム開発会社 株式会社コンフィック 当社ブログにアクセスいただき、 誠にありがとうございます。 データベース化し、同類のデータを集めると様々な分析を行うことができます。一つの例として、文書の類似度を計算 … 続きを読む データの類似度比較
テキスト変換ツール
東京都立川市のシステム開発会社 株式会社コンフィック 当社ブログにアクセスいただき、 誠にありがとうございます。 データを統一したフォーマットにする最初の処理は、テキストデータを整形することから行います。 文字種(半角・ … 続きを読む テキスト変換ツール
文章の係り受け
東京都立川市のシステム開発会社 株式会社コンフィック 当社ブログにアクセスいただき、 誠にありがとうございます。 日本語文章の記述を解析する際には、形態素解析を行い分かち書きし、その上でCaboChaなどを使いどのように … 続きを読む 文章の係り受け
電子書籍
東京都立川市のシステム開発会社 株式会社コンフィック 当社ブログにアクセスいただき、 誠にありがとうございます。 株式会社コンフィックでは、大量の電子書籍データの作成経験があります。某出版社の文庫本を大量に電子化(テキス … 続きを読む 電子書籍
LaTEX
東京都立川市のシステム開発会社 株式会社コンフィック 当社ブログにアクセスいただき、 誠にありがとうございます。 論文や学術情報の紙文書を電子化する際には、その文書内に数式が多くある場合、XMLで組版する方法もありますが … 続きを読む LaTEX
テキスト変換
東京都立川市のシステム開発会社 株式会社コンフィック 当社ブログにアクセスいただき、 誠にありがとうございます。 大量の紙文書をデータベース化する際に、まずスキャニングを行い画像化し、その後OCR処理をしてテキストデータ … 続きを読む テキスト変換
株式会社コンフィック 電子書籍
東京都立川市のシステム開発会社 株式会社コンフィック 当社ブログにアクセスいただき、 誠にありがとうございます。 スマートフォンやタブレットの普及により、紙の書籍から電子書籍での出版が多く見られるようになりました。 株式 … 続きを読む 株式会社コンフィック 電子書籍
株式会社コンフィック テキスト処理
東京都立川市のシステム開発会社 株式会社コンフィック 当社ブログにアクセスいただき、 誠にありがとうございます。 株式会社コンフィックでは、大量のデータ処理を行うことを得意としています。 データとしては、TXT、XML、 … 続きを読む 株式会社コンフィック テキスト処理
株式会社コンフィック OCRとXML
東京都立川市のシステム開発会社 株式会社コンフィック 当社ブログにアクセスいただき、 誠にありがとうございます。 インターネット上に多くの情報がある中で、過去の重要な文書はまだ紙で保管していることが多くあると思います。 … 続きを読む 株式会社コンフィック OCRとXML