日本語

Tool

「日本語ダミーテキスト生成器」の使い方 – 効率的にダミー文字列を作成する方法

日本語のダミー文字列を作るツールを作りました。
豆知識

マイナンバー通知カードは「配付」or「配布」?

マイナンバーの通知カードは届いたでしょうか。うちにはまだ届いていませんが、別の地域の住民に届いたものを、番号部分を隠して、見せてもらったところ、ペラペラのただの紙で驚きました。「カード」とは言いがたいです。さてマイナンバーの通知カードを配る...
Tool

日本語テキストを絵文字混じり文に変換する「絵文字変換器」

電子メールを使い始めて二十年くらいになると思いますが、顔文字、絵文字の類を使ったことがありませんでした。しかしiPhoneを使い始めてからは絵文字が充実してきたので使うようになりました。最近、絵文字がたくさんあることを知りました。日本語テキ...
Tool

日本語辞書の順序でソートする「日本語辞書順ソート」

プログラムを使って、ひらがなをソートすると、文字コード順にソートしてしまうので、日本語辞書通りにはなりません。大きな原因の一つは、小さな文字(捨て文字)と大きな文字の順序が逆である点です。例えば「しやく(試薬)」と「しゃく(尺)」では「しや...
Tool

gooラボAPIを利用した「日本語解析ツール」

日本語の文章を解析するツールを作りました。gooラボAPIの形態素解析、固有表現抽出、ひらがな化に対応しています。2025年8月14日追記gooラボの停止に伴い、サービスを停止しました。形態素解析については「Yahoo!の形態素解析を使う「...
デジタル

gooラボの「固有表現抽出API」を試す

NTTレゾナントが日本語解析技術に関するAPIを「gooラボ」で公開しました。いくつかありますが、その中の「固有表現抽出API」を試してみました。固有表現抽出API:文字列中の人名・地名などを抽出する技術 - gooラボサンプルは次のとおり...
豆知識

「ヶ月」でなく「か月」を使う

「いっかげつ」を表記する場合、「一ヶ月」や「一箇月」など人によって異なります。私は「一か月」と書いています。Googleで調べてみると次の通りでした。
Tool

日本語用マークダウン記法

Markdownは簡単な記号を使って書いたテキストをHTMLに変換する仕組みです。前にいくつか記事を書いています。Markdown記法のまとめ | You Look Too CoolJavaScriptでMarkdown記法をHTMLに変換...
社会

間違いやすい日本語

文化庁では国語に関する世論調査というものを毎年やっています。国語に関する世論調査|文化庁よく採り上げられるのが間違いやすい言葉や慣用句の使い方です。平成23年度から遡って平成18年度まで、この間違いやすい言葉が採り上げられなかった平成21年...
フリーソフト

WindowsでGraphvizを使う

DOT言語でテキストを書いてグラフを画像として出力するのに、GraphViz Charts — Google Developersを使っていたのですが、日本語に対応していないので、別の方法を探していました。今回、本家のソフトを使ったところ、...