SEOに携わっているとコンテンツの重要性だの、サイト速度だの色々と問題になりますが、canonicalは指定してるんだっけ?とか、追跡パラメータをcanonicalの指定URLに含めてない?みたいなチェックをサラッとやってのけたいものです。
Google Spreadsheetなら、サイト内のcanonicalで指定されているURLを簡単に抽出出来ます!
importxml("URL","//link[@rel='canonical']/@href")
です。
楽天のサイトで言えば・・・
楽天のトップページにcanonicalが指定されているわけですけど、TOPページのような大きなページは皆がチェックするから別にいいのですが、問題は中の細かいページですよね。
GoogleSpreadsheetでA列にURLを入れて、B列に先程の式を入れた場合です。
B20のセル右上に黒い三角が表示されていますが、自動的にどのURLのソースを引っ張っているかがコメントとして表示されます。
この場合、解析したいページのURLを代入すればOKなので、サンプルURLのリストさえ持っていれば、あとはURLを入れ替えていくだけでサクサクチェック完了!
importXML関数は、Xpathというものを利用していますが、ソース内の文字列を抽出することが可能なので使い道は自由!head要素内のcontentを全部引っ張るなんていう荒業も可能です。他にも便利な関数が色々あるので、ぜひ利用してみてください。
※importxml関数は1スプレッドシートに50個までしか入れられません。
0 コメント:
コメントを投稿