人民網日本語版全文検索

キーワード 

 検索システム使用方法

単一単語検索

 調べたい単語を一つ指定するだけのもっとも基本的な検索手法です。例: 人民日報

AND検索

 ある単語とある単語の両方を含む文書を検索します。検索結果を絞り込むのに有効です。3つ以上の単語を指定することも可能です。単語と単語の間に and を挿みます。例: Linux and Netscape

 and は省略できます。単語を空白で区切って羅列するとそれらの語すべてを含む文書をAND検索します。

OR検索

 ある単語とある単語のどちらかを含む文書を検索します。3つ以上の単語を指定することも可能です。単語と単語の間に or を挿みます。例: Linux or FreeBSD

NOT検索

 ある単語を含み、ある単語を含まない文書を検索します。3つ以上の単語を指定することも可能です。単語と単語の間に not を挿みます。例: Linux not UNIX

グループ化

 AND検索、OR検索、NOT検索を括弧でグループ化できます。括弧の両隣には空白を入れる必要があります。例:

( Linux or FreeBSD ) and Netscape not Windows

フレイズ検索

 2語以上からなる複合語を検索します。 "..." と2重引用符で、あるいは {...} と中括弧で囲みます。Namazuのフレイズ検索は精度が 100 % ではないため、ときどき誤ることがあります。例: {GNU Emacs}

部分一致検索

 部分一致検索には前方一致、中間一致、後方一致の 3種類があります。

前方一致検索
inter* (inter から始まる単語を含む文書を検索)
中間一致検索
*text* (text を内包する単語を含む文書を検索)
後方一致検索
*net (net で終わる単語を含む文書を検索)

正規表現検索

 検索するキーワードを正規表現で指定します。正規表現は /.../ のようにスラッシュ記号で囲みます。正規表現のエンジンにはRubyのコードを利用しています。正規表現の書式はPerlとほぼ同じです。 例: /インター?フェ[イー]ス/

フィールド指定の検索

 Subject:, From:, Message-Id: といったフィールドを指定して検索する手法です。特にMail/News のファイルを扱う際に効果を発揮します。例:

  • +subject:Linux
    (Subject: に Linuxが含まれる文書)
  • +subject:"GNU Emacs"
    (Subject: に GNU Emacsが含まれる文書)
  • +from:foo@bar.jp
    (From: に foo@bar.jp が含まれる文書)
  • +message-id:<199801240555.OAA18737@foo.bar.jp>
    (Message-Id を指定)

特記事項

  • いずれの検索方法でもアルファベットの大文字・小文字の区別はしません。
  • 日本語の複合語は形態素単位に分割し、それらを フレイズ検索します。分割は不適切に行なわれることがあります。
  • JIS X 0208 (いわゆる全角文字) の英数字と記号の一部 (ASCIIと重複しているもの) は ASCII (いわゆる半角文字) として処理されます。
  • 記号を含む語の検索ができます。例: TCP/IP。ただし、記号の処理は完全ではないので TCP and IP のように分割してAND検索をかけた方が取りこぼしがありません (その代わり余計なファイルまでヒットしてしまう可能性があります)。
  • 中間一致・後方一致、正規表現、フィールド指定の検索には少し時間がかかります。
  • and, or, not を単語として検索したいときはそれぞれ、 と2重引用符で、あるいは {...} と中括弧で囲みます。

info@peopledaily.co.jp
Copyright(C) People's Daily