さて、最近時間があればインフォシークをいじっているような気がしますが。第3回目は、キーワード検索の仕組みを見直して見たいと思います。これによって、的確なキーワードが設定できればと思っています。
前回、分かったことを反映して新たに再登録してきました。その時の設定した情報と結果は以下の通りです。
上位表示されても、人目を引く説明文でないと意味が無いので、「ウェブの箱」のうりである「しゃべるGIF」を加えています。「ホームページ作成」というキーワードを重視したため、タイトルにも「ホームページ作成支援」と加えました。さらに本文の上のほうがスコアが高くなるという予想を元に、各ページの先頭にキーワードを入れてみました。
また、上位表示を狙うキーワードが多すぎるのは無理があるので、上位表示したいキーワードを厳選してみます。まず、素材集を探している人はたぶん、「ホームページ」、「素材集」、「フリー」、「無料」などのキーワードで検索するでしょう。「色見本」、「セーフカラー」を探す人もいます。HTML を勉強したい人は「HTML」、「タグ」、「ホームページ作成」なんかで検索する人が多いようです。ネットでお小遣いなんて人は、「お小遣い」、「バナー広告」、「サイドビジネス」、「副収入」ってとこでしょうか。あとは、アクセスアップですね。「アクセスアップ」、「検索エンジン」、「上位表示」という感じでしょうか。このキーワードに絞って結果を見てみましょう。さて前回の結果と比べてどうなったでしょうか?
| キーワード | 順位 |
|---|---|
| 素材集 | 圏外 / 40,000件以上 |
| ホームページ AND 素材 | 圏外 / 40,000件以上 |
| ホームページ用素材集 | 44位 / 3,618件▲ |
| フリー AND 素材集 | 圏外 / 40,000件以上 |
| 無料 AND 素材集 | 圏外 / 763件 |
| フリー AND ホームページ AND 素材集 | 圏外 / 167件 |
| 色見本 | 圏外 / 7,362件 |
| ホームページ AND 色見本 | 20位 / 146件▼ |
| セーフカラー | 47件 / 236件▲ |
| ベジェ曲線 | 36位 / 1,444件▲ |
| ホームページ作成 | 圏外 / 40,000件以上 |
| ホームページ AND 作成 | 圏外 / 2,829件 |
| タグ | 圏外 / 40,000件以上 |
| HTML | 圏外 / 40,000件以上 |
| HTML AND タグ | 圏外 / 7,096件 |
| ホームページ作成 AND タグ | 圏外 / 1,482件 |
| お小遣い | 圏外 / 21,813件 |
| バナー広告 | 圏外 / 20,937件 |
| 副収入 | 圏外 / 8,465件 |
| バナー広告 AND サイドビジネス | 圏外 / 1,495 |
| 副収入 AND サイドビジネス | 圏外 / 3,800件 |
| アクセスアップ | 圏外 / 12,964件 |
| 検索エンジン AND 上位表示 | 4位 / 91件 |
| 検索エンジン AND アクセスアップ | 圏外 / 1,675件 |
先頭にキーワードになる単語を置いても、あまり意味がありませんでした。また今回キーワードを厳選したためか、検索結果の多い検索となってしまい、軒並み圏外に...。状況が厳しくなりました。まあ、意味の無いキーワードで上位表示されても意味が無いですからね。「ウェブの箱」で検索すれば1位ですし。
前回、「ホームページの作成」というキーワードを入れておくことで、「ホームページ作成」、「ホームページ」、「作成」の3つに対応できるかもと考えていましたが、この場合は、「ホームページ作成」のみ引っかかるようです。これで気が付いたことは、インフォシークでは助詞を取り除いた後、最長一致法でキーワードを取り出しているのでは、ということです。これは Perl などを使っていると分かりますが、正規表現などでつかう理論で、単語を取り出すときに最も長く一致するものを選ぶというものです。
例えば、「ホームページの作成をお手伝いします」と本文中にあった場合、/ ホームページ / の / 作成 / を / お手伝い / します / と分けられます。そして、助詞を無視すると、/ ホームページ / 作成 / お手伝い / となります。最長一致法を使ってキーワードを取り出すときに、「ホームページ作成」が単語としてみられると、/ ホームページ作成 / お手伝い / となるので、この文章で引っかかるキーワードは「ホームページ作成」、「お手伝い」の2つになります。当然、「ホームページ」、「作成」では引っかかりません。
多分、これで正解だと思うんですが、どうなんでしょう? このパターンで考えると大体予想通りの動きをしている気がします。結局、「ホームページの作成」で3つのキーワードをカバーすることは出来ないようです。楽な道は無いってことですね。でも、普通に文章を書いていれば、キーワードは含まれていくものなので、気にしなくてもいいかもしれません。
インフォシークの検索エンジンがキーワードを検索するのは title 要素、meta 要素の keywords 属性、description 属性、本文になりますが、どの位置にキーワードがあるかでスコアが違うようです。確信は持てませんが、title 要素 > meta 要素の description 属性 > 本文 > meta 要素の keywords 属性の順で重要度が高いようです。ただ、本文のキーワードは本文中の上のほうにある等、何らかの条件で重要度が変化しているようです。
特に重要なキーワードは、title 要素、meta 要素の description 属性、本文の3つに含めておきましょう。
検索ロボットが文章の重要度をどうやって判別しているのか疑問でしたが、冷静に考えてみると検索しているのは、「ただの文章」ではなく「HTML 文書」だということに今更ながら気づきました。どうも、文章にこだわりすぎていたみたいです。HTML 文書の場合、要素として文章を修飾しています。ということは、重要度を判断するときに要素を見ている可能性が高いということです。
重要度が高くなる可能性のある要素は、見出しを表す h 要素、強調を表す strong 要素、リンクを表す a 要素、文字の色やサイズを変える font 要素といったところでしょうか。この中で特に効果が高そうなのは h 要素ですね。h1 要素なんかだと、文章の一番大きな見出しで、内容が要約されていると判断できるはずですから。
「ホームページ作成」で上位に表示されるホームページを調べてみました。キーワードがどの要素になっているかで分けてあります。
| 要素 | 個数 |
|---|---|
| h | 1個 |
| strong | 0個 |
| a | 1個 |
| font | 3個 |
| 要素 | 個数 |
|---|---|
| h | 0個 |
| strong | 0個 |
| a | 0個 |
| font | 1個 |
| 要素 | 個数 |
|---|---|
| h | 0個 |
| strong | 4個 |
| a | 3個 |
| font | 5個 |
| 要素 | 個数 |
|---|---|
| h | 0個 |
| strong | 2個 |
| a | 0個 |
| font | 2個 |
結果を見てみるといまいち確信が持てない結果になっていますが、この他の上位表示されているページを眺めてみると、だいたい「ホームページ作成」の文字が大きく強調されている場合が多い感じがします。皆さんも好きなキーワードでざっと眺めてみてください。
前回、各ページの先頭にキーワードになる文字を見出しのように書き込んでいたので、それを h1 要素にして、次回の更新を待ってみましょう。更新が楽しみになってきました。
文章の先頭のほうにキーワードを含める作戦は、いまいち効果が見られませんでした。キーワードを引っ掛けるのには楽な道は無いのですねえ。文章中の単語がどのように区切られるか、ちゃんと見ておく必要があるでしょう。重要なキーワードは検索ロボットがのぞく部分全てに入れておくのが吉。キーワードをタグで修飾するのは効果があるかもしれません。まだまだ先は長そうです。
フレームの中のページは検索されませんが、フレームページ自体は対象になります。そこで第4回では、フレームページの有効な使い方を調べてみましょう。