Google Spreadsheetを使って、canonicalで指定しているURLをサクッとチェック


SEOに携わっているとコンテンツの重要性だの、サイト速度だの色々と問題になりますが、canonicalは指定してるんだっけ?とか、追跡パラメータをcanonicalの指定URLに含めてない?みたいなチェックをサラッとやってのけたいものです。

Google Spreadsheetなら、サイト内のcanonicalで指定されているURLを簡単に抽出出来ます!

importxml("URL","//link[@rel='canonical']/@href")

です。

楽天のサイトで言えば・・・

楽天のトップページにcanonicalが指定されているわけですけど、TOPページのような大きなページは皆がチェックするから別にいいのですが、問題は中の細かいページですよね。



GoogleSpreadsheetでA列にURLを入れて、B列に先程の式を入れた場合です。



B20のセル右上に黒い三角が表示されていますが、自動的にどのURLのソースを引っ張っているかがコメントとして表示されます。

この場合、解析したいページのURLを代入すればOKなので、サンプルURLのリストさえ持っていれば、あとはURLを入れ替えていくだけでサクサクチェック完了!

importXML関数は、Xpathというものを利用していますが、ソース内の文字列を抽出することが可能なので使い道は自由!head要素内のcontentを全部引っ張るなんていう荒業も可能です。他にも便利な関数が色々あるので、ぜひ利用してみてください。

※importxml関数は1スプレッドシートに50個までしか入れられません。
Share:

0 コメント:

コメントを投稿