Beefy Boxes and Bandwidth Generously Provided by pair Networks
Just another Perl shrine
 
PerlMonks  

Re^2: downloading a russian dictionary and getting matches with the arbitrary underpattern, a utility for crosswords

by Aldebaran (Curate)
on Dec 13, 2020 at 06:28 UTC ( [id://11125095]=note: print w/replies, xml ) Need Help??


in reply to Re: downloading a russian dictionary and getting matches with the arbitrary underpattern, a utility for crosswords
in thread downloading a russian dictionary and getting matches with the arbitrary underpattern, a utility for crosswords

check out the resources at http://gramota.ru.

I always go down the rabbit hole and never come back with a word list, but this was at least a very interesting rabbit hole, which was on the far end of the tabs: link to games resources.

I'm so blown away by this as a resource, and it would be a great way to check a given word, but I'm yet to find what I need to start playing crosswords where I can populate an array with the entire language. I'm amazed at how small that is for english.

This is what you get as output when you input пр***. It's 76 k, so don't say I didn't warn you.

прабабка, -и, р. мн. -бок

прабабкин, -а, -о

прабабушка, -и, р. мн. -шек

прабабушкин, -а, -о

прав, права, право, правы

Правда, -ы: Русская Правда, Правда Ярослава (свод древнерусского права)

правда1, -ы

правда2, нареч., вводн. сл. и союз

правда-истина, правды-истины

правда-матка, правды-матки

правдашний и правдашный

правдивейший

правдивость, -и

правдивый

правдинский (от «Правда»)

Большой толковый словарь
ПРА... Первая часть сложных слов. 1. Вносит зн.: первоначальный; исконный, древний. Праистория, прапамять, прародина, праславянский, праязык. 2. Обозначает прямую степень родства по восходящей и нисходящей линии (начиная с деда, бабки или внука, внучки). Прабабка, правнук, прадед, прапрадедушка, праправнучка. 3. Обозначает предков вообще. Праматерь, праотцы, прапредки, прародители, прародичи, прапращур.

ПРАБАБКА, -и; мн. род. -бок, дат. -бкам; ж. =Прабабушка. Портрет прабабки. <Прабабкин, -а, -о. П. браслет.

ПРАБАБУШКА, -и; мн. род. -шек, дат. -шкам; ж. Мать деда или бабушки. <Прабабушкин, -а, -о.

ПРАВДА, -ы; ж. 1. То, что соответствует действительности; истина. Истинная, святая, чистая п. Горькая п. Всё это сущая п. Сказать, узнать правду о случившемся. Историческая п. (подлинные исторические факты, события). Отвечай по правде, что случилось (честно). Что п., то п. (верно, действительно так). И то п. (выражение согласия со словами собеседника). * Правда глаза колет (Посл.). В ногах правды нет (погов.: не стоит стоять, лучше сесть). // Реалистическое изображение жизненных явлений в художественном произведении, на сцене и т.п. Художественная п. Показать всю правду жизни. 2. То, что исполнено истины; правдивость. Понимать всю правду его слов. Всё в нём дышало правдой. Люблю тебя за правду. // Разг. Правота. * Твою я правду докажу! (А.К. Толстой). Так не делают! - Твоя п. (ты прав). 3. Справедливость, порядок, основанный на справедливости. Искатель правды. Пострадать за правду. Жить, поступать по правде (справедливо, правильно). * Терпи многострадальная! Нам правды не найти (Некрасов). 4. &#1089; &#1087;&#1088;&#1086;&#1087;&#1080;&#1089;&#1085;&#1086;&#1081; &#1073;&#1091;&#1082;&#1074;&#1099; Ист. В составе средневековых названий сводов законов. Русская П. Правды германские. ◊ (Всеми) правдами и неправдами. (см. Неправда). Смотреть (глядеть) правде в глаза (в лицо). Трезво оценивать истинное положение вещей. Правда-матка (матушка). Разг. Истинная, сущая правда. Что, не нравится слушать правду-матушку? Никого не боится, так и режет правду-матку в глаза. <Правда, в зн. частицы. Выражает утверждение, уверенное подтверждение: верно, справедливо, в самом деле так. П. уезжаю. Я п. нездорова. / Употр. в вопросе, требующем подтверждения. Хорошо, что ты пришёл. - П.? Если нельзя, но хочется, то можно, п.? Интересно, не п. ли? II. в функц. сказ. Говорят, женишься? - Истинная п.! III. в зн. вводн. сл. Действительно, в самом деле. Были, п., неприятности, но обошлось. П., избегал говорить об этом. А п., почему ты не пришёл? IV. в зн. союза. Хотя. Иногда, п. редко, мы встречаемся. Послышались шаги, п. ещё далёкие. Правду (по правде) говоря (сказать), в зн. вводн. предл. Действительно, в самом деле.

ПРАВДАШНИЙ, -яя, -ее. Разг. Настоящий, действительный (обычно в речи детей). Автомобиль совсем как п. В цирке выступали правдашние медведи. <По-правдашнему, нареч. Давай бороться по-правдашнему.

ПРАВДИВЫЙ, -ая, -ое; -див, -а, -о. 1. Стремящийся к правде, говорящий правду (о человеке); свойственный такому человеку. П. характер. // Выражающий склонность к правде. П. взгляд. П-ые глаза. П-ое выражение лица. // Реалистически выражающий жизненные явления в произведениях творчества. П. художник. В своих произведениях автор прост и правдив. 2. Содержащий в себе правду, основанный на правде. П. рассказ. П-ая речь. П-ые показания свидетелей. П-ое отображение действительности. <Правдиво, нареч. П. говорить. П. смотреть в глаза. В романе п. изображена наша действительность. Правдивость, -и; ж. Отличаться правдивостью. Образы выражены с большой правдивостью.

ПРАВДИСТ, -а; м. Сотрудник газеты "Правда". Коллектив правдистов. П. с большим стажем. <Правдистка, -и; мн. род. -ток, дат. -ткам; ж. Разг. Правдистский, -ая, -ое. П. взгляд на события.

ПРАВДОИСКАТЕЛЬ, -я; м. О том, кто добивается справедливости. <Правдоискательский, -ая, -ое.

ПРАВДОИСКАТЕЛЬСТВО, -а; ср. Стремление добиться справедливости. Я не собираюсь заниматься правдоискательством.

ПРАВДОЛЮБ, -а; м. Тот, кто любит правду, истину, справедливость. Слыть большим правдолюбом. <Правдолюбка, -и; мн. род. -бок, дат. -бкам; ж. Разг.

ПРАВДОЛЮБЕЦ, -бца; м. Разг. =Правдолюб. Неподкупный п.

ПРАВДОЛЮБИВЫЙ, -ая, -ое; -бив, -а, -о. Любящий правду, истину, справедливость. П. журналист, художник. П. народ. <Правдолюбивость, -и; ж.

ПРАВДОЛЮБИЕ, -я; ср. Любовь к правде, истине, справедливости. Ценить п. в ком-л.

ПРАВДОПОДОБИЕ, -я; ср. Сходство с правдой, истиной. Выдумка полна правдоподобия. В слухах нет и тени правдоподобия. Добиваться художественной правды, а не внешнего правдоподобия.

ПРАВДОПОДОБНЫЙ, -ая, -ое; -бен, -бна, -бно. Похожий на правду. П. слух. П-ые объяснения. П-ая причина отсутствия на работе. П-ая история. <Правдоподобно, нареч. П. врать. П. разыгрывать смущение. Правдоподобность, -и; ж. П. рассказа.

Управление в русском языке
ПРАВДА — 1. &#1087;&#1088;&#1072;&#1074;&#1076;&#1080;&#1074;&#1086;&#1089;&#1090;&#1100;; &#1087;&#1088;&#1072;&#1074;&#1080;&#1083;&#1100;&#1085;&#1086;&#1089;&#1090;&#1100; чего. Правда нашего времени; &#1052;&#1072;&#1090;&#1100; говорила нежно и ласково, и я как будто почувствовал правду её слов (Акс.). 2. &#1090;&#1086;, &#1095;&#1090;&#1086; &#1089;&#1086;&#1086;&#1090;&#1074;&#1077;&#1090;&#1089;&#1090;&#1074;&#1091;&#1077;&#1090; &#1076;&#1077;&#1081;&#1089;&#1090;&#1074;&#1080;&#1090;&#1077;&#1083;&#1100;&#1085;&#1086;&#1089;&#1090;&#1080; о чём. Рассказать правду о войне.

ПРАВИТЬ &#1091;&#1087;&#1088;&#1072;&#1074;&#1083;&#1103;&#1090;&#1100;; &#1088;&#1091;&#1082;&#1086;&#1074;&#1086;&#1076;&#1080;&#1090;&#1100; кем-чем / (устар.) кого-что. Править лошадьми; Время, когда самовластно правил приисками Белозёров, навсегда ушло в прошлое (Саян.); Да правит по-русски он русский народ, а хана нам даром не надо! (А. К. Т.)

ПРАВЫЙ (прав) &#1085;&#1077; &#1080;&#1084;&#1077;&#1102;&#1097;&#1080;&#1081; &#1079;&#1072; &#1089;&#1086;&#1073;&#1086;&#1081; &#1074;&#1080;&#1085;&#1099;, &#1087;&#1088;&#1086;&#1089;&#1090;&#1091;&#1087;&#1082;&#1072; перед кем. Он считал себя всегда правым перед подчинёнными; Очевидно было, что Савельич передо мной был прав (П.).

ПРЕВАЛИРОВАТЬ (книжн.) над чем. Вопросы освоения и внедрения новой актёрской техники настолько волновали Станиславского, что начинали превалировать над всем остальным в театре (Топ.).

ПРЕВЗОЙТИ — ПРЕВОСХОДИТЬ кого-что чем / в чём / по чему. Превосходить других своими способностями; Новая Европа превзошла своим развитием цивилизацию классического мира (Черн.); Он превзошёл брата в общем развитии; По числу отличников в старших классах наша школа превзошла все городские школы.

ПРЕВОЗМОЧЬ что. Превозмочь боль; Страх превозмог самолюбие, и я принялся кричать (Акс.).

ПРЕВОСХОДИТЬ см. превзойти — превосходить.

ПРЕВОСХОДСТВО — 1. &#1086;&#1073;&#1083;&#1072;&#1076;&#1072;&#1085;&#1080;&#1077; &#1074;&#1099;&#1089;&#1096;&#1080;&#1084;&#1080; &#1076;&#1086;&#1089;&#1090;&#1086;&#1080;&#1085;&#1089;&#1090;&#1074;&#1072;&#1084;&#1080; &#1087;&#1086; &#1089;&#1088;&#1072;&#1074;&#1085;&#1077;&#1085;&#1080;&#1102; &#1089; &#1082;&#1077;&#1084;-&#1095;&#1077;&#1084;-&#1083;. над кем-чем / (устар.) перед кем-чем. Прохор с досадой сознавал её превосходство над собой (Шишк.); Превосходство машинного способа производства над ручным; Я уж не стыдился ни своего незнания, ни его превосходства передо мною (Т.). 2. &#1087;&#1088;&#1077;&#1080;&#1084;&#1091;&#1097;&#1077;&#1089;&#1090;&#1074;&#1086; &#1074; &#1082;&#1072;&#1082;&#1086;&#1084;-&#1083;. &#1086;&#1090;&#1085;&#1086;&#1096;&#1077;&#1085;&#1080;&#1080; в чём. Превосходство в технике; Противник имеет огромное превосходство в силе (Сед.).

ПРЕВРАЩЕНИЕ кого-чего (из кого-чего) в кого-что. Превращение гусеницы в бабочку; Моё превращение из ребёнка в студента... показалось им поразительным явлением (Акс.); Превращение крахмала в сахар.

ПРЕГРАДИТЬ кому-чему что. Бобров выдвинулся из тени и преградил ей дорогу (Купр.); Преградить доступ воде.

ПРЕД — ПРЕДО (предлоги) см. перед — передо.

ПРЕДАТЬ кого-что — 1. &#1080;&#1079;&#1084;&#1077;&#1085;&#1085;&#1080;&#1095;&#1077;&#1089;&#1082;&#1080; &#1074;&#1099;&#1076;&#1072;&#1090;&#1100;; &#1074;&#1077;&#1088;&#1086;&#1083;&#1086;&#1084;&#1085;&#1086; &#1086;&#1090;&#1076;&#1072;&#1090;&#1100; &#1074;&#1086; &#1074;&#1083;&#1072;&#1089;&#1090;&#1100; &#1082;&#1086;&#1075;&#1086;-&#1083;. кому (в чьи руки). Предать друга врагам; Только дома он вспомнил о том, что должен предать этих весёлых людей в руки жандармов (М. Г.); Предать своё поколение. 2. &#1087;&#1086;&#1076;&#1074;&#1077;&#1088;&#1075;&#1085;&#1091;&#1090;&#1100; &#1082;&#1072;&#1082;&#1086;&#1084;&#1091;-&#1083;. &#1076;&#1077;&#1081;&#1089;&#1090;&#1074;&#1080;&#1102;; &#1087;&#1088;&#1080;&#1074;&#1077;&#1089;&#1090;&#1080; &#1074; &#1082;&#1072;&#1082;&#1086;&#1077;-&#1083;. &#1089;&#1086;&#1089;&#1090;&#1086;&#1103;&#1085;&#1080;&#1077; чему. Предать смерти; Предать осмеянию; Предать огню; Предать полному забвению.

ПРЕДВАРИТЬ — 1. &#1089;&#1076;&#1077;&#1083;&#1072;&#1090;&#1100; &#1095;&#1090;&#1086;-&#1083;. &#1088;&#1072;&#1085;&#1100;&#1096;&#1077; &#1095;&#1077;&#1075;&#1086;-&#1083;.; &#1087;&#1088;&#1077;&#1076;&#1087;&#1086;&#1089;&#1083;&#1072;&#1090;&#1100; &#1095;&#1077;&#1084;&#1091;-&#1083;. что. Предварить события; Мне кажется вовсе не излишним предварить рассказ некоторыми биографическими сведениями (Герц.). 2. &#1091;&#1089;&#1090;&#1072;&#1088;. &#1087;&#1088;&#1077;&#1076;&#1091;&#1087;&#1088;&#1077;&#1076;&#1080;&#1090;&#1100;, &#1091;&#1074;&#1077;&#1076;&#1086;&#1084;&#1080;&#1090;&#1100; &#1079;&#1072;&#1088;&#1072;&#1085;&#1077;&#1077; о чём. Предварить о приезде; С этими самыми словами на губах предстал граф перед князем, которого уже накануне, на бале, предварил о своём посещении (Т.).

ПРЕДВЕЩАТЬ &#1089;&#1074;&#1080;&#1076;&#1077;&#1090;&#1077;&#1083;&#1100;&#1089;&#1090;&#1074;&#1086;&#1074;&#1072;&#1090;&#1100; &#1086; &#1073;&#1083;&#1080;&#1079;&#1086;&#1089;&#1090;&#1080; &#1095;&#1077;&#1075;&#1086;-&#1083;. что. Тучи предвещали грозу; Молодому артисту предвещали провал, если он примет участие в этом спектакле.

ПРЕДВОДИТЕЛЬСТВОВАТЬ &#1082;&#1086;&#1084;&#1072;&#1085;&#1076;&#1086;&#1074;&#1072;&#1090;&#1100; кем. ...Все были уверены, что он, а не кто другой, предводительствовал отважными злодеями (П.).

Русское словесное ударение
правёж, правежа, правежом


правило, -а


правило, -а (строительная линейка; сапожнаяколодка; рычаг в артиллерии; хвост у борзой)


правильный (к правило)


правильный (к правило)


правильщик


правнук


правнучка, -и; р. мн. -чек


право, -а; мн. права, прав,правам


правобережный


правобережье, -я; р. мн. -жий


правоведение


правовик, -а/


правовой


правозащитник


Словарь имён собственных
ПРАБХАКАР Мачве, Прабхакара Мачве &#1074;&#1101; (инд. писатель)

Правая Бурея, Правой Буреи (р., Хабаровск. кр., РФ)

Правая Хетта, Правой Хетты (р., Тюменск. обл., РФ)

Правдинск, -а (гор., Калининградск. обл.; пгт, Нижегородск. обл. — РФ)

Правдинский р-н (Калининградск. обл., РФ)

ПРАВИЛОВ Александр, Правилова Александра

«Право», нескл., м. (еженед., Чехия)

Правобережная ул. (в Москве)

Правобережный р-н (Сев. Осетия, РФ)

Прадо, нескл. (музей, Мадрид)

«Праздник святого Йоргена», «Праздника святого Йоргена» &#1105; (кинофильм Я. Протазанова, 1930)

ПРАКСАГОР, -а (др.-греч. врач)

ПРАКСИТЕЛЬ, -я (др.-греч. скульптор)

Прангли, нескл. (о-в, Эстония)

ПРАСАД Джайшанкар, Прасада Джайшанкара (инд. писатель)

Словарь синонимов
правая рука см. помощник

правда см. быль, да, действительно, истина, хотя Л всеми правдами и неправдами, выбрить всю правду-матку в глаза, за правду бог лица набавляет, резать правду-матку

Правдивость, искренность, чистосердечие, простосердечие.
См. честность

Правдивый, прот. Криводушный, Лживый.
См. беспристрастный, истинный, честный

правдоподобно см. вероятно

правдоподобный см. возможный

праведный см. безобидный, справедливый

Правило, закон, узаконение, начало, положение, постановление, норма, принцип, статут. Ср. Обычай и Закон.
См. закон, обыкновенный, обычай Л поставить за правило, принять за правило

Правильный, верный, безошибочный, безукоризненный, безупречный, законный, закономерный, правомерный, планомерный, гармонический, ритмический, нормальный, регулярный, резонный. Прот. Неправильный. Ср. Настоящий, Справедливый и Точный.
Л прививать правильные понятия

Правитель, управляющий, заправила, воротила, заведующий, предводитель, распорядитель, руководитель, указчик; диктатор, деспот, дирижер, регент, администратор, атаман, командир, капитан, президент, корифей, князь, король, царь, император, государь, монарх, глава, главарь; вождь. Ср. Начальник и Руководитель.
См. властитель, воротила

правительственный см. государственный, официальный

правительство см. власть, начальник, начальство

Править, управлять, заправлять, направлять, водить, верховодить, предводительствовать, вертеть, ворочать, заведывать, помыкать, располагать, распоряжаться, руководить, дирижировать, командовать, княжить, хозяйничать, начальствовать; задавать тон; держать в руках (взять в руки) бразды (кормило) правления. Править лошадьми. Направлять на путь. Вести полк. Ворочать большими суммами. Вертеть всем домом. Он заправляет делами всей общины. Какой-то всадник так коня себе нашколил, что делал из него все, что изволил. Крыл. Взять кого-нибудь в руки; иметь в своем ведении (ведомстве), водить кого на помочах. Ср. Заботиться и Господствовать.
См. исправлять

править праздник см. праздновать

правление см. власть Л бразды правления, взять в руки бразды правления, взять в руки кормило правления, держать в руках бразды п
  • Comment on Re^2: downloading a russian dictionary and getting matches with the arbitrary underpattern, a utility for crosswords

Replies are listed 'Best First'.
Re^3: downloading a russian dictionary and getting matches with the arbitrary underpattern, a utility for crosswords
by aitap (Curate) on Dec 13, 2020 at 11:47 UTC
      Let me know if you need help with translating any of that.

      I feel like we're getting somewhere now. I can see something I can use, but it's column one of a database. How do we get the words out of there and into a garden variety perl array without creating a sea of mojibake?

        To read freqrnc2011.csv into a Perl data structure, one could use Text::CSV_XS, which is smart enough to auto-decode UTF-8 bytes into Perl wide characters by default:

        use Text::CSV_XS 'csv'; my @words = map { $_->{Lemma} } @{ csv in => "freqrnc2011.csv", headers => "auto", sep_char => "\t" };
        Make sure to set an :encoding(...) PerlIO layer on your STDOUT when you work with (and print) wide characters.

        I'll have to admit that wasn't able so far to read the .var files (which seem to contain the actual words mixed with binary data when read as CP-866) from the latter source without the use of Starling for DOS from the same website. We may have to contact the original author's son about the file format if you are interested in dictionaries from there.

        perlunitut

        $ perldoc path::tinY |ack -in slurp $guts = $file->slurp; $guts = $file->slurp_utf8;

Log In?
Username:
Password:

What's my password?
Create A New User
Domain Nodelet?
Node Status?
node history
Node Type: note [id://11125095]
help
Chatterbox?
and the web crawler heard nothing...

How do I use this?Last hourOther CB clients
Other Users?
Others sharing their wisdom with the Monastery: (5)
As of 2024-04-23 07:23 GMT
Sections?
Information?
Find Nodes?
Leftovers?
    Voting Booth?

    No recent polls found