FLAGS

筆者おかあつ 大きな区分 記事の区分 記事の一覧 検索 ツイート

2013年7月4日木曜日

おかあつAJAXラオ語辞書の使い方 (oka01-cpurthzrfbsbrxlm)

以下、おかあつAJAXラオ語辞書についての説明書である。
  • 動作条件
    推奨環境はFirefox version14以上である。
    その他の環境はサポートしない。
    OSX10.6上のSafariで動作したという情報がある。
    Microsoft Internet Explorerでは動作しない。
  • バグ報告・連絡等
    作者のツイッターアカウントで報告。
  • このソフトはフリーウェアとする。利用上生じた不具合/不利益については全て自己責任とし、作者は一切責任を持たない。

    各種機能

    正規表現検索機能
    おかあつ辞書は、正規表現検索に対応している。正規表現を使うことで、タイ語・ラオ語に独特な不規則なパターンを検索することが出来る。 正規表現とは、コンピューターシステムの世界で利用される検索パターンを表現するための言語のひとつである。 正規表現に関する詳しい解説はとほほのJavaScriptリファレンス等の他の文献に譲ることとする。以下で実例を紹介する。

    あいまい声調検索
    この辞書は検索時に声調記号を無視する様に出来ている。もしも検索パターン上明示的に声調記号を指定したならばそれが優先される。


    検索結果リンク機能
    検索結果に対するリンクを作成する事が出来る。
    解説:このソフトはサーバーによらない純粋なクライアントアプリであるが、AJAX的技術を利用することで検索結果に対するリンクを作成する事が出来る。検索内容は常にアドレスバーに反映される為、通常のサーバー型アプリのアドレス同様、URLをコピーするだけで簡単にリンクを作成できる。



    開発のいきさつについて

    筆者は、タイ語の東北方言でありラオ語の方言でもあるイサーン語を研究している。イサーン語には文字が無いので、標準の綴りがない。よって発音が地域や家族・個人によって変化してしまう場合が多い。この現象により、日常会話上耳にした単語をタイ語辞書やラオ語の辞書で検索する事が難しい。細かな発音の揺れにより、辞書を検索してもマッチしないのである。

    そういうぶれに対応した検索が出来る辞書が欲しい、というのが筆者の長年の願いだった。特にタイ語では末子音の自由度が高い為、例えば語尾が ด ติ ติ์ のいずれか、という様な曖昧な検索をしたい事が多い。または、高子音字で始まる第二声調記号を使う単語で語尾が必ずติで終わるという様な検索が出来ると、学習上非常に便利である。

    またラオ語とタイ語の中間に位置するイサーン語という言語自体が持つ揺れがある為、ラオ語とタイ語を縦断的に検索し、その違いを調べるという使い方も必要である。

    幸運なことに筆者は職業プログラマである。よってこの様な学習上の要求機能を満たした電子辞書を作成する事はさほど困難なことではない。そこで、これらの辞書を縦断的に検索するプログラムを開発した。この辞書は正規表現検索に対応しており、前述のような曖昧かつ複雑な検索を行うことが出来る。

    それが、おかあつ辞書である。

    この辞書は色々な最新技術を利用して作成されている。以下で特徴を述べてみたい。
    • 全てがJavaScriptで書かれている。
      検索処理・データベース構築処理の全てがJavaScriptで書かれている。よって全てをHTML上で動作させる事が可能。クライアントで動作するのみならず,RhinoなどのJavaScriptエンジンを利用する事でサーバー上でも動作させる事も可能。
    • サーバーが無くても動作する。
      AJAXという技術を活用する事で、データベース処理結果をそのままHTMLとして表示する。おかあつ辞書は、twitterクライアントアプリやfacebookクライアントアプリなどと同じようなAJAX形式のクライアントアプリである。但し、twitterクライアントやfacebookクライアントがサーバーとコミュニケーションするアプリであるのに対して、おかあつ辞書は、全ての処理をクライアントで行なっている点が異なる。
    • オフラインでも動作する。
      ネットにつながれていないPC上でも動作する。
    • スマートフォンでも動作する。
      近年スマートフォンであればHTML/JavaScriptは動作するであろう。よってこの辞書アプリは、理論上スマートフォン上でも動作可能である。
    • FlashPlayer上でも動作する。
      FlashPlayerで利用する言語はActionScriptと呼ばれるJavaScriptの方言のひとつである。よって、FlashPlayerで動作する様に移植する事も可能である。

    残念なことに、この辞書プログラムは、辞書ファイルの版権の問題があり、筆者おかあつが個人で使用するに留めている。またこの辞書プログラムは、辞書データ込みで100MB程度あるので、ネットで配布するのが難しい。現在公開方法を模索しているところである。



    おかあつ日記をホストするこのbloggerというブログサービスでは、単独のポストに載せられる最大データサイズは1MBだが、前述のスラチャイ辞書と辞書プログラムモジュールをあわせても400kb程度で収まる事がわかった。これなら、筆者が作った辞書プログラムをスケールダウンしライト版として再構築する事で、ブログのページとして配信する事は出来そうだと気がついた。

    それが おかあつAJAXラオ語辞書 である。



    その他の記事:
    おかあつ日記:『イサーン語学習に役立つラオ語辞書・タイ語辞書』
    おかあつ日記:『おかあつ 英語/ラオ語/タイ語/日本語 縦断辞書』


    更新記録
    (Wed, Jul 25 2012 10:49:00 +0900) ラオ語辞書ライト版公開

    (Thu, 04 Jul 2013 15:30:40 +0900) AJAXラオ語辞書と名称変更。リンク切れ修正。