はてなブログでは、文章中の特定のキーワードに勝手にアンダーラインが引かれリンクになる。
無料版では標準的にはこれを消せない。
はてなブログからエクスポートするファイルにも、そのキーワードリンクはそのまま残っている。
≪サンプル≫
<a class="keyword" href="http://d.hatena.ne.jp/keyword/%B5%FE%C5%D4%C9%DC%CE%A9%BF%A2%CA%AA%B1%E0">京都府立植物園</a>
はてなブログエクスポートファイルから、このキーワードリンク<a>タグを除去するJScriptスクリプト。
// ドラッグ&ドロップしたパス情報を取得 var args = WScript.Arguments; var inputFile = args(0); var sr = new ActiveXObject("ADODB.Stream"); sr.Type = 2; // adTypeText sr.charset = "utf-8"; sr.Open(); sr.LoadFromFile(inputFile); var str = sr.ReadText(-1); // adReadAll sr.Close(); var out = str.replace(new RegExp('<a[^>]+href=\"https?://d\.hatena\.ne\.jp/keyword.*?>(.*?)</a>', 'g'), '$1') var sw = new ActiveXObject("ADODB.Stream"); sw.Type = 2; // adTypeText sw.charset = "utf-8"; sw.Open(); sw.WriteText(out, 1); // adWriteLine sw.SaveToFile(inputFile.slice(0,-4) + "-remove.txt", 2); // adSaveCreateOverWrite sw.Close();
<a>タグを除去する正規表現については、「teratail」で教えてもらった。