IV. 本資料で使用している用語について

検索サービス(検索エンジン、サーチエンジン、検索サイト)

インターネット上で公開されているWebページに関する情報をデータベース化し、 ユーザーの目的に合致するWebページを検索して、そのURLや内容を紹介するサービス。 一般的に「検索エンジン」「サーチエンジン」とも呼ばれるが、 「エンジン」という言葉が、狭義では検索技術そのものを指す場合もあり、 本資料ではサービス全体を含めて「検索サービス」という名称を使用している。

Webページ(WWWページ、ホームページ)

インターネット上で個人や団体が情報を提供しているページ。 「ホームページ」、「WWWページ」ともいう。 「ホームページ」は、一番初めの表紙にあたるページだけを指す場合もある。

URL

Uniform Resouce Locatorの略。インターネット上で、Webページの所在を特定するための文字列。

ディレクトリ型検索

「ディレクトリ」とは、大分類からそれに含まれる小分類へ、 枝分かれ式の階層構造の考え方に基づいてデータを管理する方法。 「ディレクトリ型検索」サービスでは、 あらかじめ設定したディレクトリによってWebページを整理しており、 ユーザーは目的にあったディレクトリを選んで検索を行う。

フリーワード検索

Webページがあらかじめ内容に応じて分類されている「ディレクトリ型検索」と異なり、 ユーザーが自分で検索したい任意の単語を入力して検索すること。

2-wayサーチ

フレッシュアイが名付けた名称で、 ディレクトリ型とフリーワード型の両方の検索方式を備えた検索サービス。

検索式(検索条件)

複数の単語を用いた検索のための条件を記述したもの。 一般的な記述方法として以下のようなルールを用いる。

  • AND検索
    2つ以上の検索キーワードがすべて含まれているページを検索対象とする。

  • NOT検索
    その検索キーワードが含まれていないページを検索対象とする。

  • OR検索
    2つ以上の検索キーワードを並列に扱い、 いずれかのキーワードが入っているページを検索対象とする。

  • 括弧
    括弧内の検索式を優先させることで、複雑な検索条件を設定する。

ロボット(検索ロボット、巡回ロボット)

インターネット上のWebページのリンクをたどり、 ページ情報を自動的に収集するソフトウェアの通称。

Web情報データベース

ロボットが収集した各Webページの内容を蓄積したデータベース。 フレッシュアイでは各Webページの著作権を守るため、 データを元の形には修復不可能なフォーマットで保存している。

アルゴリズム

問題を解決するためにソフトウェアに記述された手順や手続き。

全文検索

文章に含まれる一部の単語だけではなく、 文章全体を対象に検索を行うこと。

日本語処理

日本語で書かれた文章を、単語で区切ったり、 助詞や係り受け関係などを整理して処理すること。

形態素解析

文章を意味のある単語や文節毎に区切ること。

索引(インデックス)

文章中の単語や文字列に関して、 出現する回数や場所などのデータを検索しやすい順番に並べたもの。

合致度

Webページの内容が、 検索キーワードやトピックとどの程度一致しているかを判断するための度数。


プレスリリース記載の情報(製品価格/仕様、サービスの内容、お問い合わせ先、URL等)は、発表日現在の情報です。予告なしに変更されることがありますので、あらかじめご了承ください。最新のお問い合わせ先は、東芝全体のお問い合わせ一覧をご覧下さい。