in reply to Re^2: \b in Unicode regex
in thread \b in Unicode regex
Given your strings, they match fine with or without \b:
#!/usr/bin/perl -CS use HTML::Entities; my $string = decode_entities <DATA>; $_ = decode_entities "שפירא"; print "matches: '$&'\n" if $string =~ /$_/; print "matches too: '$&'\n" if $string =~ /\b$_\b/; __DATA__ 8^1589-20170113-102647-ויחי-דב +12;י_הספד_על_הר +ב_משה_שפירא.mp3 +^עברית^הרב מ +504;שה גולד^ויח +י-דברי הספד  +506;ל הרב משה שפ +;ירא, טו' טבת, ת +;שע'ז^שיעורי +501; בתנ"ך ובפרש +;ת השבוע|שיע +493;רים בפרשת ה +שבוע|שיעור• +7;ם קודמים|בר&# +1488;שית|ויחי __END__
Output:
matches: 'שפירא' matches too: 'שפירא'
So, no issue with \b and unicode regex here.
perl -le'print map{pack c,($-++?1:13)+ord}split//,ESEL'
|
---|
In Section
Seekers of Perl Wisdom