RSS を拾ってきてパースしようとしたら、不正な文字列が入っていて REXML が ParseException を投げてしまっ...
正規表現のoオプションにPerlの暗黒面を見た - はこべにっき# 実はRubyでも同じことが起こる。直訳してみた。 def m...
Webページの自動カテゴライズ の続き。 前回書いたとおり、パストラックで行っている Web ページのカテゴライズでは、Web ...
『 Rubyにも搭載(予定?)されている正規表現ライブラリ。 』
『 正規表現を簡単にチェックできるウェブサイト。ちょこっとチェックには凄く便利かも 』
すべての漢字を取り出す正規表現 がとても参考になった。結局次のような単純なコードでよいらしい。 (文字コードは UTF-8 を仮...
これをPerlで直接使えたらうれしいよね>おおる きまぐれ日記: はてなキーワードを高速に付与そこで、はてなキーワードを TRI...
任意のキャラクタ一文字とマッチします。処理系やオプション指定によって、 これが改行にマッチするものとしないものがあります。POS...
本当にやりたいことは、 型から、その型を持つようなRubyプログラムを生成する なんだけど(というかこれはHaskell界隈の人...
正規表現もRubyにおいてはオブジェクトの1つです。ここではまず正規表現の基本的な概念と使い方について確認していきます。
文章の中からあるパターンにマッチする部分があるかどうかを調べる事は比較的多く使われます。完全に一致した部分があるかどうかを調べる...
先読み正規表現について、この前やっと理解できた。Rubyリファレンスマニュアルではこんな説明になっている。 (?= ) 先読み(...
今日,BeautifulCodeを読み始めたんだけど,1章目から正規表現エンジンを実装していたりして,かなり刺激的な内容だった....
HTML要素を抜き出す正規表現を自動生成するプログラム html2regexp を作ったので公開します。 html2regexp...
『 正規表現の本家grepとfgrep(とegrep)が入ってない!!駄目じゃん/欲をいえば、ed,sed,awk,edlin,wm... 』
年の暮れだからこそ、今年の技術的なトレンドへ乗り遅れないように復習をしたいもの。 Web2.0が脚光を浴びた2005年。とりあえ...
正規表現においては、/a|b|c/(alteration)は[abc](character class)にすべし、というのは、p...
というのを作りました。http://la.ma.la/misc/js/namedcapture/正規表現の後方参照で使う部分に名...
html2regexpはHTML要素を抽出する正規表現を自動生成するツールです。 抽出対象のHTML要素を指定したHTMLファイ...
は、 渡されたテキストの末尾に "\n" があればそれを "$" にマッチさせる。 なければテキストの末尾の次に仮想的に "\n...