Version 2.2 2011/09/27
文字列リテラルまたは正規表現リテラルの区切り文字とメタ文字をエスケープします。
デリミタ
- リテラルの区切り文字を定義します。
- よく使う 4 種類のデリミタ (文字列のシングルクォート「'」とダブルクォート「"」、正規表現のスラッシュ「/」とブラケット「[]」) はあらかじめ定義されています。
- それ以外のデリミタを使うときはテキストボックスに開始デリミタを入力します。
- 開始デリミタは任意の文字列を指定できます。例: 「`」「u"」「qq/」「%Q!」
- 終了デリミタは開始デリミタの末尾 1 文字となります。ただし、末尾 1 文字が「(」「[」「{」「<」の場合はそれぞれ「)」「]」「}」「>」となります。
- [囲む] チェックボックスを ON にすると、
- エスケープと同時に両端にデリミタが付加されます。
- アンエスケープと同時に両端のデリミタが除去されます。
対象文字
- リテラル内でエスケープされるべき文字を定義します。
- デリミタとエスケープ文字 (後述) はあらかじめ対象文字に含まれています。
- それ以外の文字もエスケープするときはテキストボックスに入力します。例: 「$」「$@」「#」
エスケープ方法
- [二重化] は、対象文字が繰り返されます。例: 「"」→「""」
- [前置] は、対象文字の前にエスケープ文字が挿入されます。例: 「"」→「\"」
- 任意のエスケープ文字をテキストボックスに入力します。例: 「\」
- 正規表現のエスケープ方法は前置「\」に固定されています。
エスケープボタン
- 対象文字をエスケープします。
- [囲む] チェックボックスが ON の場合、同時にデリミタが両端に付加されます。
アンエスケープボタン
- 対象文字をアンエスケープします。
- [囲む] チェックボックスが ON の場合、同時に両端のデリミタが除去されます。
メッセージ
リテラル内の文字を Unicode または Shift_JIS のエスケープシーケンスに変換します。
- Unicode エスケープは Java の native2ascii に相当します。
- Unicode のエスケープ結果はコードポイント値ではなく UTF-16 でエンコードされた値です。サロゲートペアは 2 個のエスケープシーケンスに変換されます。
対象文字セット
- 変換対象とする文字の種類をチェックリストの中から選択します。文字セットの説明 を参照してください。
デリミタ
- リテラルの区切り文字を定義します。定義方法は リテラル1 と同じです。
エスケープボタン
- 選択した対象文字セットに属する文字をエスケープシーケンスに変換します。
- [囲む] チェックボックスが ON の場合、同時にデリミタが両端に付加されます。
アンエスケープボタン
- 選択した対象文字セットに属するエスケープシーケンスを元の文字に戻します。
- [囲む] チェックボックスが ON の場合、同時に両端のデリミタが除去されます。
オプション
- [1バイトずつエスケープ]
- 2 バイト文字を 1 バイトずつに分けてエスケープします。例: 「あ」→「\x82\xA0」
- アンエスケープはこの設定に影響されません。1 バイトずつの「\x82\xA0」も 2 バイトずつの「\x82A0」も同様にアンエスケープされて「あ」に戻ります。
メッセージ
Shift_JIS で第 2 バイトに 0x5C を含む、いわゆる「ダメ文字」をエスケープします。
- 対象文字は「―ソЫ\噂浬欺圭構蚕十申曾箪貼能表暴予禄兔喀媾彌拿杤歃濬畚秉綵臀藹觸軆鐔饅鷭xx\\」です。
- NEC 選定 IBM 拡張文字の「x」(0xED5C)・「x」(0xEE5C) は、Windows では IBM 拡張文字の「x」(0xFA78)・「x」(0xFB78) に統一して扱われるため、対象文字に含まれていません。
エスケープボタン
アンエスケープボタン
HTML/XML 文書中の文字を文字参照または実体参照に変換します。
対象文字セット
- 変換対象とする文字の種類をチェックリストの中から選択します。文字セットの説明 を参照してください。
エスケープボタン
- 選択した対象文字セットに属する文字を参照に変換します。
アンエスケープボタン
- 選択した対象文字セットに属する参照を元の文字に戻します。
オプション
- [16進でエスケープ]
- 文字参照を 16 進表記にします。例: 「あ」→「あ」
- アンエスケープはこの設定に影響されません。16 進表記の「あ」も 10 進表記の「あ」も同様にアンエスケープされて「あ」に戻ります。
メッセージ
文字列を URL エンコード/URL デコードします。
符号化方式
- 符号化方式を選択します。詳しくは ecl.txt を参照してください。
エンコードボタン
- 選択した符号化方式で文字列を URL エンコードします。
デコードボタン
- 選択した符号化方式で文字列を URL デコードします。
Web サービスを利用して URL を短縮/復元します。
サービス
- サービスを選択します。
- goo.gl: Google の提供する URL 短縮サービスです。
- bit.ly: bitly の提供する URL 短縮サービスです。
- j.mp: bitly の提供する URL 短縮サービスです。
- is.gd: Memset の提供する URL 短縮サービスです。
- v.gd: Memset の提供する URL 短縮サービスです。元の URL へ飛ぶ前に確認が入ります。
短縮ボタン
復元ボタン
文字種を変換します。
- [ひらがな → カタカナ]
- ひらがなをカタカナに変換します。
- [カタカナ → ひらがな]
- カタカナをひらがなに変換します。
- [半角カナ → カタカナ]
- 半角カナをカタカナに変換します。
- [カタカナ → 半角カナ]
- カタカナを半角カナに変換します。
- [英数記号 ⇒ 半角]
- 全角の空白・記号・英数字を半角に変換します。
- [英数記号 ⇒ 全角]
- 半角の空白・記号・英数字を全角に変換します。
- [小文字 → 大文字]
- 英小文字を英大文字に変換します。全角英字も変換されます。
- [大文字 → 小文字]
- 英大文字を英小文字に変換します。全角英字も変換されます。
- [語頭 ⇒ 大文字]
- いわゆるキャピタライズです。英文中の単語の先頭を大文字に、先頭以外を小文字に変換します。全角英字は変換されません。
- [大文字を含む語はそのまま]
- このチェックボックスを ON にすると、現に大文字を含む単語は変換されません。例:「I bought my iPad in eBay」→「I Bought My iPad in eBay」
- [文中にある n 文字以下の冠詞・前置詞・接続詞は小文字]
- このテキストボックスに文字数を入力すると、 a, aboard, about, above, across, after, against, along, alongside, among, an, and, around, as, at, before, behind, below, beneath, beside, besides, between, beyond, but, by, concerning, despite, down, during, except, for, from, in, inside, into, less, like, minus, near, nor, of, off, on, onto, opposite, or, out, outside, over, past, plus, round, save, since, so, than, the, through, throughout, till, to, toward, under, underneath, until, up, upon, via, with, within, without, yet のうち指定した文字数以下の単語は、文頭・文末を除き、すべて小文字に変換されます。
- [タブ → スペース]
- ハードタブをソフトタブに変換します。行頭以外のタブもスペースに変換されます。
- [スペース → タブ]
- ソフトタブをハードタブに変換します。行頭以外のスペースもタブに変換されます。
文字列を数値と見なして基数変換します。
- 複数の数値を一括変換できます。選択範囲内の単語ごとに、その単語が変換元基数の数値として解釈できれば、変換されます。例: [16進 → 10進] のとき、「A 20 pounds of beef steak」→「10 32 pounds of 48879 steak」
基数
- 変換元と変換先の基数をテキストボックスに入力します。2 進から 36 進まで任意の基数を指定できます。
変換ボタン
文字列を数式と見なして計算します。
- [Google 電卓]
- 数式を Google 電卓で計算します。
- Google 電卓の出力形式が変更された場合、結果が取得できなくなる可能性があります。気づいた人は作者に教えてください。〈→談話室〉
リテラル2 と HTML/XML では、変換対象とする文字の種類をチェックリストの中から選択します。リスト上の個々の選択肢を文字セットと呼びます。
リテラル2 の Unicode と Shift_JIS および HTML/XML の 文字参照 で選択できる文字セットの内容は次のとおりです。
いいかげんな説明
- [ASCII]
- いわゆる半角英数字です。半角スペース・半角記号を含みます。
- [ASCII 制御文字]
- タブ文字や改行文字などです。
- [JIS X 0201 半角カナ]
- いわゆる半角カナです。
- [JIS X 0208 基本漢字]
- いわゆる全角文字から機種依存文字を除いたものです。全角空白・全角記号・全角英数字・ひらがな・カタカナ・第一水準漢字・第二水準漢字を含みます。
- [JIS X 0213 拡張漢字]
- 日本語のいわゆる Unicode 文字です。第三水準漢字・第四水準漢字・非漢字を含みます。
- [Windows 機種依存]
- Windows の機種依存文字のうち JIS X 0213 に収録されていないものです。
- [<その他の文字>]
- 上記以外の文字 (ハングルなど) です。
厳密な説明
- (注1)
- JIS X 0213:2004 に収録されている文字のうち、Unicode で合成文字として表現されるものは、Windows では構成要素単位で別個の文字として扱われるため、[JIS X 0213 拡張漢字] に含まれていません。
- (注2)
- JIS X 0213:2004 に収録されている文字のうち、「〜」(U+301C, WAVE DASH)・「‖」(U+2016, DOUBLE VERTICAL LINE)・「−」(U+2212, MINUS SIGN) は、Windows では JIS X 0208-1997 に収録されている「〜」(U+FF5E, FULLWIDTH TILDE)・「‖」(U+2225, PARALLEL TO)・「−」(U+FF0D, FULLWIDTH HYPHEN-MINUS) とそれぞれ同一視されるため、[JIS X 0213 拡張漢字] に含まれていません。
HTML/XML の 実体参照 で選択できる文字セットの内容は次のとおりです。
いいかげんな説明
- [']
- 「'」です。
- [& < >]
- 「&」「<」「>」です。
- [ ]
- 半角スペースです。
- ["]
- 「"」です。
- [xhtml-lat1]
- 欧文アクセント付きアルファベットなどです。このうち「´¨±×÷°§¶」は基本漢字にもあります。
- [xhtml-special]
- 欧文約物やユーロ通貨記号などです。このうち「‘’“”‰†‡」は基本漢字にもあります。
- [xhtml-symbol]
- 数学記号などです。このうち「…≠∞∴′″→←↑↓∈∋⊆⊇⊂⊃∪∩∧∨⇒⇔∀∃∠⊥∂∇≡√∝∫」とギリシャ文字「Α」〜「Ω」「α」〜「ω」は基本漢字にもあります。
厳密な説明
- [xhtml-lat1]
- http://www.w3.org/TR/xhtml1/dtds.html#a_dtd_Latin-1_characters
- [xhtml-special]
- http://www.w3.org/TR/xhtml1/dtds.html#a_dtd_Special_characters
- [xhtml-symbol]
- http://www.w3.org/TR/xhtml1/dtds.html#a_dtd_Symbols
ユーザーは目的に応じて文字セットの内容をカスタマイズできます。
- リテラル2 の Unicode と Shift_JIS および HTML/XML の 文字参照 で使われる文字セットの内容は、本体マクロと同じフォルダにある拡張子 .enum のテキストファイルに UTF-16 で列挙されています。ファイル名の拡張子を除いた部分がチェックリストの項目名となります。
- HTML/XML の 実体参照 で使われる文字セットの内容は、本体マクロと同じフォルダにある拡張子 .ent のテキストファイルに HTML のエンティティとして記述されています。これらは W3C が配布しているもの がそのまま使えます。ファイル名の拡張子を除いた部分がチェックリストの項目名となります。
ダイアログ上で [<その他の文字>] が選択できる場合、文字セットの内容は互いに排他的でなければなりません。
- [<その他の文字>] を選択したとき、内部的には、選択していない文字セットに含まれる文字を除いた全ての文字が変換されます。ある文字セットに含まれる文字が他の文字セットにも含まれていると、どちらか片方の文字セットと [<その他の文字>] を同時に選択したとき、ユーザーの意図と異なる結果になりえます。
- 例えば、文字セットを [ASCII] と [JIS] の 2 つに単純化したとして、もし両方の文字セットに同じ文字が含まれていたら、下図のようなことになります。
- 拡張漢字にも機種依存文字があります
-
対象文字セットで [Windows 機種依存] と [JIS X 0213 拡張漢字] のどちらかだけを選択すると表示されます。いわゆる機種依存文字 (NEC 特殊文字・NEC 選定 IBM 拡張文字・IBM 拡張文字) のうち、JIS X 0213:2004 に収録されているものは [JIS X 0213 拡張漢字] に、それ以外は [Windows 機種依存] に含まれています。すべての機種依存文字を変換対象とするには、チェックリストで [Windows 機種依存] と [JIS X 0213 拡張漢字] の両方を選択してください。
- Shift_JIS 範囲外の文字は「・」になります
-
Shift_JIS の対象文字セットで [JIS X 0213 拡張漢字] を選択すると表示されます。この場合、Windows の Shift_JIS (Microsoft CP932) で表現できない文字は「\x8145」(「・」、中黒) に化けます。
- [二重化] が選択されています。区切り文字とメタ文字をそれぞれ次のように変換しますか?
-
対象文字がデリミタとメタ文字を合わせて 2 文字以上あるとき、[二重化] を選択してエスケープ/アンエスケープしようとすると表示されます。この場合、それぞれの対象文字が個別に二重化されます (例: 対象文字が「&%"」のとき、「&Say "%s".」→「&&Say ""%%s"".」)。この動作が意図したものなら [はい] を、キャンセルするには [いいえ] を押してください。