gooラボAPIを利用した「日本語解析ツール」
日本語の文章を解析するツールを作りました。
gooラボAPIの形態素解析、固有表現抽出、ひらがな化に対応しています。
ゆるくつくる stabuckyのブログ
NTTレゾナントが日本語解析技術に関するAPIを「gooラボ」で公開しました。
いくつかありますが、その中の「固有表現抽出API」を試してみました。
固有表現抽出API:文字列中の人名・地名などを抽出する技術 - gooラボ
サンプルは次のとおりです。PHPで書きました。 (さらに…)
Markdownは簡単な記号を使って書いたテキストをHTMLに変換する仕組みです。
前にいくつか記事を書いています。
Markdown記法のまとめ | You Look Too Cool
JavaScriptでMarkdown記法をHTMLに変換 | You Look Too Cool
便利なのですが、元々、英語用なので日本語になじまない点があります。
例えば、見出しは「#」を使いますが日本語では使いません。
改行は半角スペース2個を末尾にわざわざ付ける必要があります。これがないと改行せずに前の行の後ろにそのまま続けます。
そこで、日本語にもなじむ記法を考えました。
基本的なところは次のとおりです。 (さらに…)
文化庁では国語に関する世論調査というものを毎年やっています。
よく採り上げられるのが間違いやすい言葉や慣用句の使い方です。
平成23年度から遡って平成18年度まで、この間違いやすい言葉が採り上げられなかった平成21年度を除いた5年分の「問題」をまとめてみました。 (さらに…)
DOT言語でテキストを書いてグラフを画像として出力するのに、GraphViz Charts — Google Developersを使っていたのですが、日本語に対応していないので、別の方法を探していました。
今回、本家のソフトを使ったところ、日本語が使えたので紹介します。Windows7で確認しました。 (さらに…)
「彷彿とさせる」と「彷彿させる」はよく見かける表現ですが、どちらが正しいのでしょうか。
結論から言うとどちらも正しいそうです。
詳しくまとめたページがありました。 (さらに…)
Markdown記法というのがあるそうです。
主なルールは次の通り。
マークアップの代表的なものはHTMLですが、読みにくいのが一番のデメリット。
読みやすさを失わず、マークを付ける、というのが、Markdown記法の目的です。 (さらに…)
先日、WordPress3.0の英語版にアップグレードし、日本語のカテゴリーやタグのページが開かない場合の対処法を書きました。
ようやく日本語版が出たので再度、アップグレードしたところ、また日本語のカテゴリーやタグのページが開かなくなってしまいました。
これはWordPressの問題ではなく、レンタルサーバの問題ですね。