• WP Multibyte Patch

  • 2010年1月18日
  •      
  • No Comments »
  • wordpress
    WordPress の開発者およびユーザーの多くはマルチバイト文字以外の言語圏の人であるため、日本語の取り扱いが考慮されていなかったり、不十分な箇所がまだあります。そこで重要なのがWP Multibyte Patch。WordPress日本語版のマルチバイト文字に関する修正を行うプラグインです。メール送信、トラックバック受信、ピンバック受信、検索等で発生する障害に対して対策を行ってくれるらしいです。WPを触りだした当初(他者制作テンプレート使用)、このプラグインが有効・無効どちらでも何ら影響がなくあまりピンと来なかったのだけど、今回テンプレートを制作する上で有難みを感じたのです。WP日本語版に初めから同梱されている理由をここで理解することになりました。

    日本語・マルチバイト特有の問題には以下のものが挙げられます。

    —————————————————————————————————
    ■文字コードに関する問題

    UTF-8 以外の文字コードからのトラックバックの文字化け
    現在の WordPress 英語版・日本語版は UTF-8 を標準にしていますが、その他(例: EUC-JP や Shift_JIS)の文字コードを使っている他のレンタルブログサービスやブログツールなどからトラックバックを受けると文字化けが発生します。
    UTF-8 以外の文字コードからのピンバックの不具合
    UTF-8 以外の文字コードを使っている他のブログからピンバックを受けると本文の抜粋が空になります。
    メールの文字化け
    デフォルトでは UTF-8(8ビット)でメールを送信するため、ISO-2022-JP の携帯メールやメールクライアントでの文字化けが発生します。
    マルチバイトファイル名の変換
    ファイル名のマルチバイト部分が変換されずにアップロードされます。
    —————————————————————————————————
    ■文字数カウントに関する問題

    抜粋の不具合
    単語間のスペース区切りで文字数をカウントしているため、本文が日本語の場合に自動抜粋がうまく短縮されません(手動抜粋、ティーザーには影響なし)。
    投稿画面の不正な単語数カウント表示
    日本語で本文を書いた場合、投稿画面の下部にリアルタイムで表示される単語数カウントが正しく計算されません。
    —————————————————————————————————
    ■日本語特有の文字に関する問題

    検索での全角スペース無視
    単語間のスペース区切りで文字数をカウントしているため、本文が日本語の場合に自動抜粋がうまく短縮されません(手動抜粋、ティーザーには影響なし)。
    投稿画面の不正な単語数カウント表示
    検索キーワードとして入力した日本語の全角スペースがスペース区切りとして認識されません。
    —————————————————————————————————

    というような問題があり、マルチバイト言語圏では欠かせないプラグインがWP Multibyte Patchのようです。ぼくが有難みを感じた瞬間についてはまた後日紹介します。
    参照:WordPress日本語EastCoder;