ORIST技術交流セミナー・ビジネスマッチングブログ(BMB)第37回勉強会報告 その②Google

皆さんお待たせしました。先月7月25日(火)に開催された「ORIST技術交流セミナー・ビジネスマッチングブログ(BMB)第37回勉強会」その②は、Google金谷さんの講演報告です。

「モバイル検索ユーザーの増加に伴うGoogle検索の今、企業が取り組むべき課題とは!?」

グーグル株式会社 シニアサーチ・エヴァンジェリスト 金谷 武明 氏

グーグル株式会社 シニアサーチ・エヴァンジェリスト 金谷 武明 氏


キーワードはきちんとユーザーを見る


1. Googleとはどんな会社か Googleのミッションは

  • 「世界中の情報を整理して世界中の人々がアクセスできて使えるようにすること」 Googleのすべてのプロダクトはこのミッションの元にあるので、例えばYouTubeやアンドロイドは何のためにあるかと疑問を持った場合は、このミッションのことを念頭に置いて考えれば一歩深く理解できるのではないかと思う。 例えばアンドロイドに関していうと、10年前にスマホはほとんどなかったわけだが、それをアンドロイドによって屋外でも検索ができ、javascriptやcssのサイトもPC版と同じように屋外でも安全に高速に見られるようになった。

2.    Googleの検索エンジンについて

ー検索の仕組みー

  • 「完璧な検索エンジンとは、ユーザーの意図を正確に把握し、ユーザーのニーズにぴったり一致するものを返す検索エンジンである」と、ラリーページは言っている。 Googleの検索結果はどの順に並んでいるか。検索しているキーワードから検索意図を読み取り、その検索意図、検索キーワードに関連性が高いものから順番に並べている。 検索結果の順位で1位を取りたいのなら、“ユーザーが探している情報で1位になるように情報を提供するように努力すれば良い”ということになる。
     
  • インターネット上に現在130兆ページがgoogleに把握されている。一ヶ月に1000億以上の検索が行われている。検索エンジンは毎回130兆ページを見に行っているわけではない。 サイトの存在を知り、見に行って取得し(クロール)、索引を作る(インデックス)、そこで初めて検索作業が行われて、検索のキーワードを持ってインデックスサーバーの中を見に行き、関連性の高いページを10個配信する。この4つのステップが検索の仕組みである。

2.1 クロール(見にいって取得する)

  • 130兆のサイトがクロールの対象。全部を一度に見に行くことは無理なので優先度をつけてクロールのスケジュールが立てられている。例えば、重要なページには頻繁にクロールに行くが、更新されてないようなページはクロールの頻度は少ない。同じコンテンツ、同じ情報がある場合は優先度が下がるので、クロールの頻度が少なくなる。また、ユーザーがクロールをコントロールできるようになっている。robots.txtを使ってクロールさせないようにすることもできる。

2.2 インデックス(集めてきた情報を理解して整理する)

  • インデックスサーバーは無制限のサイズというわけではないので、ページを選別する必要がある。重複するページがあったら1つ主要なページを優先的にインデックスして他は割愛することもあるし、いろんな観点から価値が低いと判断されたらインデックスしないようなこともある。

2.3 ランキング

  • ランキングはアルゴリズム(プログラムのようなもの)が自動で決定している。ユーザーの探しているキーワードと関連性が高いと思われる情報を、200以上あるアルゴリズムのシグナルに基づいて検索結果を自動的に計算して表示している。アルゴリズムのシグナルの数が200以上あるために、あるアルゴリズムを解析して検索順位の仕組みを知ろうとしても徒労である。 ユーザー毎に違う結果、検索キーワード入力に使うデバイス毎に違う検索結果を出す(違うランキングが出る)。

グーグル株式会社 シニアサーチ・エヴァンジェリスト 金谷 武明 氏

3.  サーチコンソールを使う

  • Googleのクロール、インデックス、検索結果の配信結果を皆さんがチェックできるようなツール(無料)があり、これがGoogleのサーチコンソール(旧ウェブマスターツール)である。

3.1 サイトのパフォーマンスを知る(Googleの検索に対して)

  • どのくらい表示されて、どのくらいクリックされて、平均の掲載順位は何位くらいで、という情報をキーワード毎だったりページ毎に見ることができる。

3.2 サイトの問題を知る

  • Googleがクロールやインデックスの際に気づいたエラーがあれば、それを表示してくれる。

3.3 PCとモバイルを分けて分析する

  • 例えばPCとモバイルを分けて見るとモバイルの方がクリック数が高く、PCの方が表示回数が多いというデータが得られることがあり、デバイス毎に対応を考える必要性に気づくことになる。
     
  • レスポンシブの場合はPCもモバイルもURLが一緒なので、データが一緒に出てくる。フィルターデバイスー比較の所でPCとモバイルを設定してから違うページを分析しに行くことで、PC/モバイルの比較という状態をキープしたまま他のデータを分析することが可能になる。これを必ずやっていただきたい。

グーグル株式会社 シニアサーチ・エヴァンジェリスト 金谷 武明 氏

4. サイト運営時に遭遇する問題

Webマスター向けガイドライン

4.1 スパムサイトに指定される話

  • Webスパムとは、検索結果の掲載順位を正規の方法(ユーザーのためになるようなサイトを作って順位を上げる)ではなく、詐称のテクニックで順位を上げようとする方法。その結果、全くユーザーの意にそぐわない可能性のある情報をユーザーの目に触れさせようとする。そうしたスパム対策として、Googleはアルゴリズムや手動による対策(問題解決)を行っている。手動対策の場合にサーチコンソールで通知や申請を扱える。
     
  • 特に気をつけなければならないのは有料リンク。約5年前までは、SEO=有料リンクの購入と考えられていた時代があり、Googleは10年以上前からリンクに関しては買わないようにと注意してきたが、にも関わらず有料リンクの売買というのは行われてきた。最近は減っているが、あの手この手の営業文句とともに依然として存在している模様で、それを良かれと思って購入している会社もあると聞く。結局、これは順位を上げたかったにも関わらず順位を下げる結果になる。
     
  • ペナルティー解除はサーチコンソールで手動でやることになる。ちなみにリンクが1万本あるとすると、手動で1万本を再審査リクエストで提出する必要があるので膨大な労力がかかる。有料リンクには手を出さないように。関係者が勝手にリンクを設置していないか確認するように。

4.2 再審査リクエストの話

  • 方法は下記のとおりいたってシンプル。
     
    • 1.メッセージをよく読み、違反箇所を修正する。メッセージに書かれてない箇所を修正する人がいるが意味がない。
    • 2.修正する以外に下記の添え書きの提出が必要    ― なぜ違反が発生したのか    ― どのような修正を行ったのか ― 今後どのように違反を防ぐのか
    • 3.最終手段として否認ツールというものがある。否認ツールを使う前に不自然なリンクを取り除く努力をすること。初めから否認ツールを使ってリンクを外して再審査リクエストをしてもそれは通らない。
       
  • 再審査リクエストは迅速に行うこと。不正が発覚したが、できるところまでこのままやり続けようとする態度は良くない。

4.3 不正なハッキングの話

  • 不正なハッキング(クラッキング)が起きた後に何が起こるかという話。大きく4つに分類される。
     
    • ①サイトが改竄されてウィルス等マルウェアが埋め込まれる
    • ②既存のページを書き換えられる
    • ③新しいページを埋め込まれる
    • ④別のサイトにリダイレクトされる
    • ③と④のケースはサイト運営者が気付きにくいので厄介。
    • ④はトラフィックが別のサイトに行ってしまうのでビジネスへの影響が大きい。
    • ④はクローキングという手法で発見されにくい状態になっていたりする。
       
  • ウェブマスター(サイト所持者)やユーザー、Googleボットは同じものを見ているが、Googleボットに対しては改竄されたページ(リダイレクト先にある場合もある)を返し、ウェブマスターやユーザーに対しては元のページを返す(見せる)。このため、サイトがハッキングされ改竄されているということが分かりにくい。
     
  • この改竄されたページがリダイレクトされていた場合(①+④のケース)、Googleボットはリダイレクト先を見に行くので、やがて皆さん(サイト所有者)の正規のページがインデックスされなくなることにもなる。これがクローキングである。
     
  • クローキングのパターンは様々で、検索からきたユーザーだけリダイレクトされるという手口なども存在する。
     
  • クローキングは検出しにくい。対策としては、サーチコンソールのFetchAsGoogleから見ること。FetchAsGoogleは、サイトのページをGoogleボットが見ているのと同じ状態で見ることができるので、クローキングされていたらクローキングされた後のページを表示する。
     
  • そもそも不正なハッキング自体を防ぐためにはどうすべきかというと、簡単なパスワードを使わないようにする(デフォルトのパスワードのままにしておかない、推測しやすいパスワードを使わない)とか、CMSを最新のものに保つのが良い。WordPressのバージョンを古いままにとめている人がいるが、それは本当に危険で、おすすめ出来ない。 Googleの「ハッキングされたwebサイトに関するヘルプ」にハッキングされた場合の対処法を載せている。

Googleセミナー

5.  モバイルに対応する

5.1 モバイルファーストインデクシングの話

  • クローラーにはPC用のクローラーとモバイル用のクローラーがある。
     
  • 以前はサイトにモバイル用のページとPC用のページがある場合、Googleはそれらを関連する1つのセットとして扱っていた。PCの検索ではPC用ページを検索結果に出し、モバイルの検索ではモバイル用ページを出していた。そしてどちらの場合も、PC用のクローラーでクロールした情報を元にランキングを決めていた。
     
  • 一般にモバイルサイトはPCサイトに比べ、提供する情報量を削っている場合が多く、逆はほとんどない。そのような場合、PC用に書かれている情報を使って検索結果を決めるがゆえに、PC用の情報内にだけ存在するキーワードでランクインしている検索結果がモバイル(で見ている)ユーザーに返されると、モバイルユーザーはサイトを訪問してもキーワードを含む情報を得られないという問題があった。
     
  • 2015年時点からGoogle検索はモバイルユーザーの方が多く使っていたので、より多くのユーザーに不都合が生じている状況を変えるため、今後はPC用のクロールの情報をサブにし、モバイルのクロール情報をメインとして扱っていく。つまり、ランキングもモバイルのクローラーが集めてきた情報を元にランキングを作り、PC版の検索結果のランキングもこのモバイル版のクローラーが集めた情報を元に作っていく予定である。
     
  • 一言でまとめると、メインのクローラーを入れ替えるという話
     
  • この場合、問題となってくることがある。現時点でGoogleが把握している問題は大きく2つある。
     
  • 1つはリッチスニペット。構造化データを実装されている人の多くはPC版しか実装していないので、モバイルファーストインデックス実施後は、それらのデータがきちんと表示されなくなってしまう。だから、モバイルサイトにもリッチスニペット、構造化データを設置するように変更していただきたい。
     
  • もう1つは画像のAlt属性の設定。PCではalt属性を設定している人でもモバイルサイトでは設定していない人が多いので、画像検索から来ているユーザーを重要視している人は今後、モバイルサイトでもalt属性を設定するように注意してください。

5.2 AMP

  • 今、モバイルユーザーにとって一番ストレスなことは何かと言えばスピードである。モバイルサイトがいっこうに開かない経験をしたことがある人は多い。
     
  • 「サイトの起動時間が3秒以上だと53%のユーザーがアクセスを断念してしまう。起動時間が1秒遅れるだけで、コンバージョン数が7%下がってしまう。」
     
  • クリックしてから表示するまでの時間が問題視されており、対策としてGoogleが取り組んでいるオープンなプロジェクトとしてAMPがある。
     
  • AMPの特徴は以下の通り。
     
    • 速い
    • 実装が簡単(HTMLベースの技術なので)
    • モバイルフレンドリー
    • オープンなので、Googleだけでなく様々なプラットフォームで利用されはじめている
    • マネタイズが可能
       
  • AMPがサクサクと速く動く理由は、HTTPリクエストの回数を減らしている(モバイルサイトのページのコンテンツの長さを短くして対応しようと考える人もいるようだが、実は表示時間短縮にはあまり効果がない)ため。
     
  • JavaScriptを同期しているものは時間遅延に関わっているので、非同期のものに限定している。
     
  • 画像サイズを指定して、指定した画像を読み込むことで、読み込みが終了すると同時に開くようにしている(サイズ不明の画像だとレンダリング後に初めてサイズが確定するため、一旦画像が消えて再度表示される場合があり、それによって時間ロスが生じる。)
     
  • AMP最大の特徴は、サイトを置いているサーバーから配信される代わりに、世界中に配置されているAMPサーバーから配信されること。このため、どれだけトラフィックが集中してもサイトを置いているサーバーが落ちることはない。なぜならキャッシュされているAMPサーバーから配信されるから。
     
  • AMPの開発状況だが、静的なページにしか使えないと言われていたが、現在はAMP-bindというものを使うことでECサイトのカートのようなものにも対応できる技術になってきている。

5.3 PWA (Progressive Web Apps)

  • 海外でAMPとPWAの組み合わせで使われ始めている。 アプリの良いところをWebページに使おうという話。
     
  • Webの良さはブラウザから様々なサイトにアクセスできること。アプリではアプリで決められた専用サイトの情報しか取ってこれない。アプリのようにダウンロードする必要がないのでネットに繋がってさえいればどんなコンテンツでも見られる。プラットフォームに依存しない。
     
  • アプリの良さは、ホーム画面のアイコンからアクセスすることができる。 オフラインでも使えるようにできる。プッシュ通知で新しい情報などを知らせることができる。 これらのことを全て出来るようにしたのがPWA。
     
  • AMPと違って、PWAという1つの仕様、フォーマットがあるわけではない。また、アンドロイド専用でiphoneでは使えない。いわゆるWebのテクノロジーというよりはアンドロイドのテクノロジーであり、アンドロイドの開発のノウハウが必要になってくるので難易度は高い。

Google金谷さん

6.今後の情報収集の方法