東京都立川市のシステム開発会社 株式会社コンフィック 当社ブログにアクセスいただき、 誠にありがとうございます。 テキスト処理をする際に、不要な改行やスペースを除去したり、記号の全角・半角を統一したりといった、データを整 … 続きを読む テキスト変換ツール公開!
投稿者: root
データ処理とコーパス作成
東京都立川市のシステム開発会社 株式会社コンフィック 当社ブログにアクセスいただき、 誠にありがとうございます。 株式会社コンフィックでは、大量文書を取り扱う中で、コーパス作成をご依頼いただくことも多くあります。 コーパ … 続きを読む データ処理とコーパス作成
形態素解析
東京都立川市のシステム開発会社 株式会社コンフィック 当社ブログにアクセスいただき、 誠にありがとうございます。 日本語の文章は英語や韓国語と異なり、単語に分かち書き(スペースが入る)がされていません。 そのため、文章か … 続きを読む 形態素解析
多言語でのWebサイト構築
東京都立川市のシステム開発会社 株式会社コンフィック 当社ブログにアクセスいただき、 誠にありがとうございます。 株式会社コンフィックでは、多くのWebサイトを構築した経験があり、日本語だけではなく、多言語に対応したサイ … 続きを読む 多言語でのWebサイト構築
レポートの相互評価
東京都立川市のシステム開発会社 株式会社コンフィック 当社ブログにアクセスいただき、 誠にありがとうございます。 多くの学生が受講している講義では、その学生全員のレポートを教員が全て確認し、評価することはとても時間がかか … 続きを読む レポートの相互評価
開発チーム
東京都立川市のシステム開発会社 株式会社コンフィック 当社ブログにアクセスいただき、 誠にありがとうございます。 株式会社コンフィックでは、日々研究開発を行っております。 開発チームでは、文書に纏わるシステムやWebサイ … 続きを読む 開発チーム
対訳データ
東京都立川市のシステム開発会社 株式会社コンフィック 当社ブログにアクセスいただき、 誠にありがとうございます。 文章を翻訳する際には、日本語1文に対して訳文1文としておくと、対訳データとして活用することが可能です。 翻 … 続きを読む 対訳データ
用語の抽出
東京都立川市のシステム開発会社 株式会社コンフィック 当社ブログにアクセスいただき、 誠にありがとうございます。 大量文書から用語を抽出することで、その文書の概要を把握することが可能です。 文書にある用語の出現頻度をリス … 続きを読む 用語の抽出
データの類似度比較
東京都立川市のシステム開発会社 株式会社コンフィック 当社ブログにアクセスいただき、 誠にありがとうございます。 データベース化し、同類のデータを集めると様々な分析を行うことができます。一つの例として、文書の類似度を計算 … 続きを読む データの類似度比較
謹賀新年
東京都立川市のシステム開発会社 株式会社コンフィック 当社ブログにアクセスいただき、 誠にありがとうございます。 新年明けましておめでとうございます。 旧年中はご厚情を賜り、誠にありがとうございました。 皆様のご健康とご … 続きを読む 謹賀新年