【ブログ運営6か月】京大生が”ちょっと”本気を出してアクセス分析してみた

データ分析・統計・数学
ブログ執筆者
ブログ執筆者

2021年3月20日のブログ初投稿から約6か月が経過しました。ちょうど半年だということで、データもそれなりにたまってきました。そこで、Google AnalyticsやGoogle Search Consoleを利用していろいろとデータをいじってみたいと思います。

分析の目的

何の目的もなしにデータをいじくるのもあまり面白くないので、なんとなく「分析の目的」なるものを定めておきました。

それは、

ブログアクセスの動向を見るときに注目すべき指標は何か、ということを探る

です。

アナリティクスなどを見ていると、データの種類が多過ぎて全てに目を通すのは(不可能ではないにしても)なかなか難しいです。なので「自分が注目すべきデータは何なのか?」ということをきっちり見極めなければなりません。

しかし、「自分が注目すべきデータ」がどういうものなのかをまず大まかに決めておかなければ、これまた「見極め」にも時間がかかりすぎてしまいます。

そこで「このブログで自分はどうしたいか?」を考えました。それは…

Google検索でやってくる読者に有意義な情報を与えたい。
(それによって自分の「他者貢献感」を高めて生活の満足度を上げたい)

です。

ちなみに「収益が~」ということはあまり気にしていなくて、「AdSense広告・アフィリエイト収益がたまたま入ってくればいいや」くらいに思っています。なにせブログは趣味でやってるので。

…まあ、こんな感じのことをベースに分析を進めていきます。

本記事の構成は以下の通りです。

基本的な指標を確認

まずは基本から。ここでいう「基本的な指標」というのは次の4つです。

  • 表示回数
  • クリック数
  • CTR(クリック率)
  • 掲載順位

各指標の定義を確認しておく

念のため、それぞれの指標の定義もここで確認しておきます。どのようにしてデータが集められているのか、というのも重要な視点ですから。

表示回数は、WebサイトへのリンクがGoogle検索結果に表示された回数を指します。 リンクがユーザーの目に触れたかどうかにかかわらず、当該リンクが掲載された検索結果ページがユーザーに表示された時点でカウントされます。

サーチコンソールの表示回数とは?カウント方法の考え方と注意点『SEO研究所サクラサクラボ』2020年10月12日投稿 URL:https://www.sakurasaku-labo.jp/blogs/search-console-implessions

クリック数とは、ユーザーがGoogleの検索結果画面でWebサイトのURLを何回クリックしたかの実測値です。

サーチコンソールの検索パフォーマンスの計測範囲はGoogleのみで、Yahoo!をはじめとするほかの検索エンジンは対象外となります。

クリック数計測の対象となるURLは、Googleが正規ページとしてインデックス登録しているURLのみです。例えば、スマホ版とパソコン版が異なるURLで、Googleがパソコン版URLを正規ページとインデックスしている場合は、クリック数はパソコン版URLに統合されます。

サーチコンソールのクリック数とは?カウント方法の考え方と注意点『SEO研究所サクラサクラボ』2020年10月12日投稿 URL:https://www.sakurasaku-labo.jp/blogs/search-console-clicks

CTRは、Click Through Rateの略語で、オーガニック検索結果に表示された回数のうち、ユーザによってクリックされた割合を指します。

Googleサーチコンソールで各ページのCTRを確認する方法『ANATOMY』2020年9月25日最終更新 URL:https://siteanatomy.com/role/ctr.html

「掲載順位」は、あるリンクがページ内で表示された位置を、ページ内の他の結果に相対的なものとして、近似的に示すことを狙った指標です。この指標は、Search Console では「平均掲載順位」として示されます。これは、すべての表示について掲載順位の平均をとったものです(リンクの掲載順位は表示されるたびに変わるため)。

表示回数、掲載順位、クリック数とは『Search Console ヘルプ』2021年9月30日アクセス URL:https://support.google.com/webmasters/answer/7042828?hl=ja

データをながめる

まずは、基本4指標をざっとながめてみます。

青線が実測値,赤線が7日間移動平均を表す。これ以降のグラフについても同様。

どの指標を見ても、6月下旬から7月上旬あたりで大きな転換点を迎えています。ブログ開設から約3か月後のことです。ブロガー界でよく聞く「Googleに認められるまでに3か月かかる」という基準は、やはり正しいことがわかります。

そしてその後は、おおよそ1か月の周期で推移していくことが見てとれます。この「1か月」という数字に意味があるのかと考えましたが、良い説明が思い浮かびません。データが足りず周期とは断言できないので、そもそもこれを「周期」と捉えるのは違うのかもしれません。

そこで、ピーク時の日付に注目してみました。

まず最初のピークが「7月中旬~下旬」でした。この時期はちょうど夏休みが始まる時期なので、計画をたてたり勉強法を見直したりする人が多く、Google検索をする学生が多かったからではないかと推測されます。

そして次のピークが「8月中旬」でした。お盆の時期です。学生だけではなく日本全体が休暇の時期になったから、検索数が増えたのでしょうか。あるいは、夏休みの折り返し地点が過ぎ、勉強法を見直す人が多かったからかもしれません。

そして直近のピークが「9月中旬」です。このピークは他と比べて小規模でした。中高生の夏休み明け、といったところでしょうか。あるいは、新しく作った記事の影響でしょうか…?実は9月に入ってから、ブログ記事の中心を勉強法から他のジャンルにうつし始めました。その中で1つ”小さなアタリ”があったのでその影響もあるかもしれません。

ざっとデータを見た感じは以上の通りです。次は各指標について詳細に見ていきます。

表示回数

6月下旬から7月上旬にかけて一気に伸びたあとは、横ばいの傾向が続いています。

しかし、直近に大きな上昇ポイントがあり上昇の兆しが見えています。少しずつですが、上昇傾向にあります。

ちなみに8月23日あたりに大きな減少がありましたが、調べてみたところSearchConsoleの不具合によるものでした。

クリック数

クリック数はおおむね上昇傾向にあります。

直近の「クリック数」は減少している一方、直近の「表示回数」は上がっています。これは相反する結果になっています。おそらく「CTR」が最近になって下がっていると思われます(このあとCTRの考察)。

CTR(クリック率)

前節でみたように、CTRが最近になって大きく下がっています。

「検索下位では表示されるもののクリックされていない」という状況なのでしょうか…。次の「掲載順位」で確認してみます。

掲載順位

やはり…。前節の考察通り、掲載順位も下がっていました。

競合サイトのリサーチをあまりやってこなかったので、なるべく上位表示されるように対策する必要性を感じました。

「伸び率」で指標を追跡する

実測値だけではなく、どれだけ数字が伸びたかを表す「伸び率」について調べました。

それが下のグラフです。

前日と比べてどれだけの比率か
前週と比べてどれだけの比率か
の2つを図示してみました。

紺色の点線は単回帰直線を表す。以降のグラフも同様。なお、縦軸の目盛りはすべてそろえた。
縦軸の目盛りはそろえてある。

縦軸の「1」のところに赤線を引っ張っておきました。このラインを超えると「成長している」、下回ると「退化している」ことを表します。

「前日」で比べてしまうとあまりにもガタガタしすぎていてよくわかりませんでした。なので「前週」と比べた指標で考察しました。

実測値で考察した通り、

表示回数の伸び率=減少傾向
クリック数の伸び率=増加傾向

とわかります。幾何平均からも同様の傾向がわかりました。

記事数は指標に影響してないの?

勘の鋭い人は、次のようなことを考えたのではないでしょうか。

記事の数が増えれば「表示回数」が増えるのは当然だ…。

そうです、その通りです。

なので、その時点で記事が何個あったかを考慮してグラフを作り直しました。

そのグラフと元のグラフを比べたのが下の図です。

ちなみに、クリック数についても同様の結果だった。

どうでしょう…?

「1記事あたり」で換算をしても、数字の動きはほとんど変わりませんでした。なので、わざわざ1記事あたりの指標に換算する必要はあまりないことがわかります。

「良い直帰」と「悪い直帰」を区別する

また直帰率上がった…。オワタ…。

という人がいるのですが、「直帰率が上がる=悪い」とは限らないと僕は考えました。

直帰には「悪い直帰」と「良い直帰」があるのだ、と僕は思うのです。

「直帰率が高い」には2つの原因

直帰するときには、次の2つのシナリオが考えられます。

  • 記事リンクを開いてちょっと読んでみたが、求めている情報がなさそうなので帰った。
  • 記事を最後まで読んで、検索の目的を達成して満足できたので帰った。

つまり直帰する人には、

なんだ、この記事。期待外れだな。他の記事を探そ…

という人と、

なるほど!ではでは、スマホを置いてさっそく実践実践…

という人の2種類がいると考えられます。

「平均ページ滞在時間」で区別してみる

しかし、データ上ではこの2種類の人がまとめて「直帰率」と表されてしまうわけなので、「良い直帰」と「悪い直帰」の区別ができません。そこで、何とか工夫して区別できないか?と自分なりに考えてみました。

それで思いついたアイデアは「平均ページ滞在時間」で区別するということです。

さっきの、

なんだ、この記事。期待外れだな。他の記事を探そ…

という人なら「ページ滞在時間」は短いだろうし、

なるほど!ではでは、スマホを置いてさっそく実践実践…

という人なら「ページ滞在時間」は長いと考えられます。

それを利用して区別をしてみよう、というわけです。

区別した結果…?

下図は、
横軸:「直帰率
縦軸:「平均ページ滞在時間
のようにとった散布図です。(数値は標準化済)

図中の数字は記事IDを表す。

この図の読み取り方としては、

左上=理想的(直帰率[小]・滞在時間[長])
右上=良い(直帰率[大]・滞在時間[長])
左下=ビミョー(直帰率[小]・滞在時間[短])
右下=悪い(直帰率[大]・滞在時間[短])

となります。(良いビミョーの上下関係は人によって違ってきますが)

でも、どこで区切るかが迷いどころです。

そこでコンピュータ君にお願いして、わけわけしてもらいました。その結果が下の図。

K-means法でクラスタリング(n_clusters=4)した結果。手法の選び方はテキトーです。まだまだ勉強中なので許してください。

色で分けてくれました。

ただしこれは、「コレとコレは近いから、同じグループだねー」っていう感じ(あくまでイメージ)にわけわけしてもらった結果なので、この分け方がはたして正しいのかどうかは僕にはわかりません。

でも、一つの目安には充分なりえると思います。

この散布図を参考にすれば、「記事の満足度」みたいなものも分かるんではないでしょうか。この「満足度」を基準にリライトを考えたりとか、タイトルを変えてみたりとか、いろいろできそうです。

「記事カテゴリ別」に評価する

どういう記事が読まれるのか?

ここまでは、記事全体をデータのふるいにかけて考察してきましたが、ここでは各記事をカテゴリごとに分類したうえで集計してみます。

記事をカテゴリ別にまとめてデータをながめることで「どの記事が読まれやすいか?」を知ることができると考えました。

そのデータをもとにして、指標をUPできるように記事のテーマ選びをしていきたいと思います。

どう集計するか?

「じゃあ、どういった変数を使って記事カテゴリの評価をするのか?」ですが、ここでは基本4指標を使います。

しかし、「クリック数」「表示回数」は昔に書いた記事ほど、そして記事数が多いほど、必然的に多くなってしまうので、1日当たり・1記事あたりに調整しました。

その結果が下図。

クリック率でみると、最近書き始めた「統計・数学」のジャンルが1位でした。これからもこの調子で書き続けて、記事数が増えた後どうなるのか、追跡していきたいと思います。

クリック数表示回数では「計画術」がダントツの1位です。「計画」のジャンルがウケやすいのは経験的にわかっていたのでその成果でしょうか。

…このように記事カテゴリ別に集計すると、(それぞれの指標において)どのカテゴリの記事を書くべきかがはっきりします。

【おまけ】検索ワードをワードクラウド化

User Local のAIテキストマイニング(https://textmining.userlocal.jp/results/wPBLzMEwJZRbMAqHBGey3V14meaS4q1E)を使用。

検索ワードについてのデータもあったので、完全に興味本位でワードクラウドにしてみました。

まとめ

今回分析したこと
  • 基本4指標の動向
    • CTR・掲載順位に課題あり。競合サイトの調査を行う。
  • 基本4指標の伸び率の動向
    • 直近の伸び率がマイナスに。
  • 「良い直帰」と「悪い直帰」の区別
    • 「ページ滞在時間」を利用して区別。
  • 記事カテゴリ別に集計
    • 各指標ごとで評価が異なるため、目的に応じてデータ活用。

今回は以上になります。

自分オリジナルの分析ですが、他のブロガーさんが分析するときのお役に少しでも立てられたら幸いです。

記事への意見・感想はコチラ