検索エンジンの仕事

多くの初心者のウェブマスターやインターネットサーフィンのファンは、検索エンジンはどのように機能しているのかという疑問に関係しています。 検索エンジンの基本原則 今日は議会国を検討します。




現代の検索エンジンは、驚異的な速度で動作する最も複雑なプログラムとアルゴリズムで構成される複雑な全体です。想像してみて、新しい 検索アルゴリズム Googleのカフェインは、わずか1秒で3kmのA4シートに相当する情報を処理できます。



すべての検索エンジンで、ソフトウェアコンポーネントは5つの主要なグループに分けられます。



  • "スパイダーズ"

  • "旅行するスパイダー"

  • インデクサ

  • データベース

  • 結果システム



クモ - スパイダー(スパイダー) - そのアルゴリズムはブラウザに似ていますが、視覚的な要素はありません。スパイダーはhttpプロトコルを使用してページのhtmlコードを読み込みます。



サーバへのロボット要求は、"Get / path / document"とその他のhttpリクエストコマンド。この要求に対して、スパイダーは、文書および文書自体に関するサービス情報を含むテキスト・ストリームとして、サーバーから応答を受信します。スパイダーは、検索エンジンの索引付けモジュールの一部です。



"トラベリングスパイダー" - クローラ - 別のコンポーネントです索引付けモジュール。クローラは、ページ上のスパイダーによって検出されたすべてのハイパーリンクを自動的にナビゲートし、検索エンジンにまだ知られていないドキュメントを検索します。



ロボット - インデクサー (インデクサ)は、スパイダーロボットによって読み込まれたページのコンテンツと直接連携します。インデクサは、ページの形態的、語彙的分析を行い、それらを別々の部分に分割する。



データベース (データベース)は、コンポーネントによって収集および索引付けされた索引文書を保管するように設計された特別なソフトウェアです。



検索エンジンの結果エンジン - 結果を出すためのシステムは、最も重要なものの1つです検索エンジンのコンポーネントエンドユーザが処理している出力システムが検索文字列にクエリを入力します。 200以上の異なる基準に基づいて結果を出力するシステムは、検索目的を最も満足する結果の選択を実行する。



そのような選択のアルゴリズムは、通常、アルゴリズムまたは 順位付けの仕組み。発行結果に影響を与えるためにウェブマスターの一部で不正を避けるために、正確なランキングアルゴリズムの検索エンジンは厳密な秘密に保持されます。



それにもかかわらず、ウェブマスターが検索結果に「合法的に」影響を及ぼすことを最適化する、検索エンジンの作業において考慮される多数の既知の基準が存在する。例えば、 ページを分析するときの検索エンジンは考慮に入れます




  • ページのタイトルにキーワードがあるかどうか(タイトル)

  • キーワードはページのURLに表示されますか?

  • ヘッダーH1〜H6にキーワードがあるかどうか、タグSTRONG、B、EM​​、I

  • ページ上のキーワードの密度(密度)

  • キーワードがメタタグに存在するかどうか:キーワード、説明

  • ページに内部リンクと外部リンクがありますか?



ユーザは、検索サーバを介して検索エンジンと対話する。 ユーザーからの検索クエリを受信しましたサーバは、ランク付けモジュールを処理し、パラメータとして入力として渡す。次に、モジュールは文書の処理を行い、その情報は検索システムのデータベースに格納され、ユーザの要求に対応するページの評価を行う。



次に、システムは、ユーザにSERP(検索エンジン結果ページ)の形で表示されるスニペットテキスト情報を生成する。 検索結果ページ.



したがって、メインの簡単な説明検索エンジンの原則は、システムのソフトウェア・コンポーネントのすべてと、どれだけとデバッグを迅速かつ確実に彼の検索に関する情報をユーザに提供するために、検索エンジンを動作させる必要がありますどのように密接に相互に連結を示しています。



検索エンジンの仕事
コメント 0