超漢字ソリューション for Oracle

―多漢字データベースシステム構成例―

on oracle logo

「超漢字ソリューション for Oracle」では、Oracleに超漢字ベースの端末を接続することによって、多漢字という付加価値を付けることが可能となります。多漢字の技術は、多数の人名用漢字を扱うべき電子政府向けのクライアント端末をはじめ、住民票や戸籍の管理システム、図書館情報端末、電子ブック端末などに今後大きな需要を見込める技術です。「超漢字ソリューション for Oracle」は、多漢字を扱うデータベースの実現に最適なソリューションを提供します。


また、Oracleを使った既存のデータベースシステムの追加あるいは置換用端末として、「超漢字ソリューション for Oracle」を部分的に導入していくことも可能です。この方法であれば、既に実績のあるデータベースシステムをそのまま用いながら、多漢字も処理可能なシステムへと段階的に移行していくことができますので、データベースシステムの変更に伴うコストを最小限に抑えることができます。

住民票の検索例

読みによる住民票の検索

住民票のデータベースから、「たかさき」という住民を検索するところ。

住民票のデータベースの検索

住民票の検索結果

「たかさき」の検索結果。

「たかさき」の検索結果

taka」「saki」など、JIS第1・第2水準範囲外の文字も表示されている。

なお、このブラウザでは、不特定多数のユーザからの操作を考慮したキオスクモードを使用している。

▼システム構成例

図1 システム構成例

システム構成例

データベース層

Oracle Workgroup Server
RDBMS本体。実際のデータベースを保持

中間層

Blackdown JDK
Linux上の Java Developer Kit
(JDBC、JServ (Servlet) を動作させるために使用)
Oracle JDBC Driver (Thin)
Oracleと JDBC接続できるようにするためのドライバ
Apache JServ + Sun Java Servlet Development Kit
Apache Web Server用アドオンモジュール
Java Servlet Development Kit (JSDK) 2.0のServletエンジン実装。プログラムロジックを実行。
Apache Web Server
World Wide Web (WWW) サーバ。HTTPプロトコルを処理

データベース層と中間層との通信には Oracle Net8、中間層とフロントエンドとの通信には HTTPを使用します。

多漢字検索の例

フロントエンド (端末側ブラウザ) からの検索要求を中間層 / データベース層で処理し、結果がフロントエンドに返るまでの流れを説明します。

  1. 端末側ブラウザが、WebサーバからHTMLフォームが含まれたページを受理する。
  2. ユーザがHTMLフォームへ検索要求を入力する。
  3. 端末側ブラウザが、Webサーバへ検索要求を出す。
    この時、端末側ブラウザでJIS第1・第2水準範囲外の文字を入力することも可能。 その場合は、入力された文字がテキスト形式TRONコード に変換されてからwebサーバに送信される。
    例: 「草nagi」は「草&T21bc74;」 へと変換される。
    図2 端末側ブラウザから中間層への検索要求
    端末側ブラウザから中間層への検索要求
  4. 中間層が、Webサーバの受け取った検索要求によりServletプログラムを実行し、検索要求に応じたSQL文をOracleデータベース本体に送る。
  5. Oracleが、SQL文に変換された検索要求にしたがってデータベース本体の検索を行い、条件にあったデータを Servletへ返す。
    この時、データベース本体や検索結果にJIS第1・第2水準範囲外の文字を含めることも可能である。その場合、JIS第1・第2水準範囲外の文字はテキスト形式TRONコードで表現される(注1)
    図3 中間層からOracleデータベース本体を検索
    中間層からOracleデータベース本体を検索
  6. 中間層が、Oracleデータベース本体から返された検索結果のデータをHTML形式に変換し、WebサーバからHTTPを介して端末側ブラウザに送る。
  7. 端末側ブラウザが、検索結果を表示する。その際、中間層から送られたHTMLデータにテキスト形式TRONコード(&Txxyyyy;形式)の文字列が含まれていた場合には、該当する実際の文字に変換して表示する(注2)
    例: 「草&T21bc74;」 は 「草nagi」へと変換して表示される。
    図4 中間層から端末側ブラウザへの検索結果の送信
    中間層から端末側ブラウザへの検索結果の送信

異体字を含めた多漢字の検索処理例

データベースの機能を使って、異体字を含めた検索を行うことも可能です。異体字を含めた検索を行う場合、前項の処理4, 5に次の処理が加わります。

  1. まず、Oracle上に構築した異体字データベースを検索して、検索対象文字の異体字(複数)を検索する。
    なお、異体字データベースはJIS第1・第2水準範囲外の文字を含むことが多いため通常はテキスト形式TRONコード(&Txxyyyy;形式)で構成される。
  2. 次に、その検索結果を使って、Oracleデータベース本体を検索する。
  3. 処理(4-1)で見つかったすべての異体字に対する、処理(4-2)の検索結果をマージする。
    図5 異体字を含めたデータベースの検索
    異体字を含めたデータベースの検索
    また、上記の方法以外に、端末側ブラウザのOSである超漢字が持っている検字用データベースを活用して、異体字を含めたOracleデータベースの検索を行うことも可能です。ただし、この場合は、超漢字上の検字用データベースを検索するために、ブラウザ以外の特殊なアプリケーションが端末側にも必要になります。

三国志の検索例

三国志の武将名の検索例

katsu」「kaku」「en」など、JIS第1・第2水準範囲外の文字も表示されている。

三国志の武将名の検索例

詳細情報画面およびデータベース中のJIS範囲外漢字の属性表示

検索結果の画面に表示された「katsu」というJIS範囲外の文字を、文字検索ユーティリティにドラッグすることにより、その文字の種類、区点コード、文字情報、関連字などを表示できる。この画面例に出てくる「katsu」は台湾の文字(CNS,1面70区22点)であり、JIS第1水準の「葛」とは下部の字形が少し違っている。

詳細情報画面例

補足

テキスト形式TRONコード
「テキスト形式TRONコード」とは、BTRONで扱う文字のTRONコードの値を、“&Txxyyyy;”の形式の文字列に展開したものです。ここで、“xxyyyy”はTRONコードの16進表記を表わし、上位2桁(xx) が言語指定コードの下位バイト (21~3f)、下位4桁(yyyy) がそれぞれの言語面(スクリプト)の中での文字コードに対応します。
たとえば、tou小平の「tou」(JIS補助漢字66区39点,1-E247)に対するテキスト形式TRONコードは "&T21e247"、三国志の諸katsu亮孔明の「katsu」(台湾1面70区22点,6-6636)に対するテキスト形式TRONコードは、“&T266636;”となります。
異体字
たとえば、通称「ハシゴ高」と言われている「taka」という漢字は、「高」の異体字であり、「taka橋」「taka田」のような人名の一部に使われています。また「yoshi田」「yoshi川」といった人名に使われる「yoshi」は「吉」の異体字ですし、「山saki」「高saki」といった人名に使われる「saki」は「崎」の異体字です。
人名用の漢字には特に多くの異体字があり、その多くはJIS第1・第2水準に含まれないため、コンピュータ上で正しい人名を扱う際の問題点の1つになっていました。
注1)
データベースの構成によっては、JIS第1・第2水準範囲内の文字を含めて、すべての文字をテキスト形式TRONコード(&Txxyyyy;形式)で表現するケースもあります。その場合は、処理4の段階で、検索要求に含まれるJIS第1・第2水準範囲内の文字もテキスト形式TRONコードに変換します。また、処理6の段階で、検索結果に含まれるJIS第1・第2水準範囲内の文字を、テキスト形式TRONコードから実際の文字(シフトJISコード等で表現)に変換します。
注2)
超漢字以外のwebブラウザからこの多漢字データベースをアクセスした場合、JIS第1・第2水準範囲外の文字はテキスト形式TRONコード(&Txxyyyy;形式)のまま表示されますが、JIS第1・第2水準範囲内の文字に関しては、通常通り入力や表示ができます。すなわち、超漢字以外の既存の端末で直接多漢字を扱うことはできないものの、多漢字を扱う端末と多漢字を扱わない端末とを運用上分離できれば、既存の端末と「超漢字ソリューション for Oracle」との混在システムも現実的に有効なソリューリョンの1つとなります。

ご注意

「超漢字ソリューション for Oracle」は、お客様のご要望に応じて個別にお見積り、ご提供を行うシステムソリューションです。また、お客様の手配されたSI業者様と協力してご対応する形態や、本システムの構成モジュールをSI業者様に対する部品としてご提供する形態、当社が多漢字データベースを構築するSI業者様のお手伝いをする形態も可能です。詳細についてはお気軽に当社までお問い合わせください。

お問合せ

詳細につきましてはお気軽に下記の担当窓口へお問い合わせください。

パーソナルメディア株式会社 営業部
TEL.03-5749-4933 FAX.03-5749-4936
E-mail:sales@personal-media.co.jp

  • TRON は "The Real-time Operating system Nucleus" の略称です。
  • BTRON は "Business TRON" の略称です。
  • BTRONとは、コンピュータの仕様に対する名称であり、特定の製品を指すものではありません。
  • B-rightはパーソナルメディア株式会社の登録商標です。
  • 超漢字はパーソナルメディア株式会社の商標です。
  • Oracleは米国ORACLE Corporationの登録商標です。On Oracleは、ORACLE Corporationの商標です。また、本文中のその他の商品名等は各社の商標または登録商標です。
  • 「超漢字ソリューション for Oracle」とは、以前からご案内していた「超漢字/Oracleソリューション」の名称を変更したものです。

ページの先頭へ戻る

HOME > 製品一覧 > 超漢字ソリューション > 超漢字ソリューション for Oracle