Форум » Справочная » Пользовательские словари » Ответить

Пользовательские словари

KOMODOR: Представляю на суд свои словари. 1. Слова исключительно нарицательные и почти все - с подстановочными знаками. 2. Ученые 3. Писатели 4. Политические деятели. 5. Античность Словари, конечно, неполные, зато в них самое основное. Настоятельно рекоммендую не бездумно вставлять, а просмотреть вручну, благо они не очень большие. ссыль

Ответов - 43, стр: 1 2 3 All

MoppoH: да словари конечно мелковаты, надо хотя бы на пару тысяч слов и желательно в таком формате антипохмельн*=антипохме<льн антисистемн*=антисисте<мн аравийск*=арави<йск Арсенальн*=Арсена<льн асиманск*=асима<нск астринг*=астри<нг бальзамин*=бальзами<н бамбад*=бамба<д *башенн*=ба<шенн Беспилотник*=Беспило<тник *бетонн*=бето<нн

KOMODOR: в таком формате проблематично - местный спойлер какой-то недоделанный и 2 спойлера сливаются в 1, а без спойлера - в мусорно. Да и, думается, много слов сразу, - не есть кул. тут надо обдуманн подходить, а то как со словарями от говорилки - загружаешь "мегакрутойсловарь.dic", а на выходе получаешь такое, что...

Cminant: KOMODOR Чтож хорошее начало Если будет нужно, можно на форуме отдельный раздел для обмена словарями сделать. Для выкладывания не слишком больших словарей можно использовать сайты наподобие http://pastebin.com/ (их на самом деле вагон и тележка, google, как говорится в помощь =) - там можно копировать/вставлять через буфер любые текстовые данные без заморочек с обменниками/архивами...


KOMODOR: А может сделать словарик в гуглодокументе? Тогда каждый сможет заходить и вносить изменения. Лучше даже не конкретно словарик, а текстовый файл, в который каждый может зайти, и оставить сообщение, типа "Я Васька собакин, вот мои правила: ...".

olelog: так и не понял, как пользоваться словарями, как редактировать, ударение в слове которое неправильно произносит Николай (напримпр слово положение, и полноценно) Какие словари нужно загружать в программу, загрузил все которые вы дали на сайте 6 штук, программа виснет,вылетает, процессор перегружается. Где взять инструкцию пользователю вашей программой ? Форум-справка это не то что нужно.

MoppoH: Для начала закидываешь словари в эту папку D:\KooBAudio2.1\Dic затем открываешь программу и нажимаешь редактор словарей ударений затем нажимаешь на выбрать активные словари там есть 3 раздела для словарей, 1 предварительная обработка 2 словари ударений 3 постобработка, текст обрабатывается этими разделами по очереди, ставим галочки у словарей чтобы добавить их в список словарей далее выбираем словарь в который хотим добавить неправильно читаемое слово, так как слова одиночные я их добавляю у себя в словарь "слова для замены в конце" внизу в левом окошке пишем само слово, нажимаем на = и слово появляется в правом окошке, кликаем мышкой где должно быть ударение и нажимаем на значок <, ниже окошек есть динамики нажав на которые можно прослушать как звучало слово без ударения и с ударением если и после этого слово произноситься неправильно, то в Редакторе словарей нажимаем на показать окно отладки пишем в верхнем окошке слово и если у вас стоит автообновление в нижнем окошке покажет ударение в слове, а еще ниже покажет словари где это слово есть возможно в словарях которые обрабатывают текст раньше есть слово со звездочкой например полноцен=полно<цен* которое и ставить неправильно ударение в слове полноценно пы.сы. вот ссылка на мои словари, я их постоянно редактирую и обновляю каждый месяц http://koobaudio.narod.ru/load/dic/moi_slovari/1-1-0-9

olelog: MoppoH Огромное Вам спасибо за выложенную информацию, все получилось, но в процессе все равно возникает масса вопросов: 1. Скачал ваши словари, и сразу после первого запуска программы распаковал их в папку Dic, предварительно удалив старые. 2. Далее импортирую книгу в библиотеку. При импорте книги и ее сохранении в проекте разве не идет обработка вашими словарями ударений ? 3. Словарный анализ текста, как править и правильно сохранять корректируемые слова ? Да и после такой коррекции и сохранении в словаре, нужно повторно книгу обрабатывать словарями ударений ? 4. Есть ли какой либо "бэкап" своих настроек программы, своих словарей итп. Или в дополнительно папке Users\... \AppData\Roaming\KooDAudio как у меня например нужно сохранять какие либо файлы, или всю папку делать резервную копию. 5. Если я в разделе Проект - словарный анализ текста, сохраняю слова с измененными ударениями в словаре для замены в конце, как вы и рекомендуете, то как мне правильно например в случае переустановки программы, или еще каких проблем с компом использовать мои сохраненные данные для переноса ну например в обновленную версию, или после обновления ваших словарей, которыми я буду пользоваться ? Назовем это - "правильный Бэкап и обновление данных" 6. Непонятно по отладке проекта, как пользоваться ? 7. При закрытии программы, или ее "вылете" на каком то этапе нужно ли опять проводить довольно длительную процедуру обработки словарями ударений ?

olelog: olelog Синтез речи- Управляющие теги ELAN или SSML ? каково их отличие, какой выбрать ? ну никакой информации.

Cminant: 1. Скачал ваши словари, и сразу после первого запуска программы распаковал их в папку Dic, предварительно удалив старые. 2. Далее импортирую книгу в библиотеку. При импорте книги и ее сохранении в проекте разве не идет обработка вашими словарями ударений ? Если не забыли поставить "галочки" наротив словарей как на третьем скриншоте, то да, обработка начнется автоматически после добавления книги. В графе "статус" будет отображаться "Подготовка [...%]" 3. Словарный анализ текста, как править и правильно сохранять корректируемые слова ? В правой части окна отображаются слова из книги в порядке частоты употребеления. По умолчанию показываются только имена собственные, это можно измениить в выпадающем списке фильтра выборки (1) Красным цветом будут выделены слова, для которых в текущем наборе словарей уже нашлось правило для замены, т.е. ударение в них уже скорее всго поставлено. При желании такие слова можно скрыть вовсе в выпадающем меню кнопки "фильтр" (2) При выборе слова в списке оно будет произнесено, а чуть ниже отобразится небольшой список с другими формами слова (с различными окончаниями) найденные в основном списке. Если ударение в слове произносится неправильно, нужно проставить символ ударения "<". для этого достаточно кликнуть мышью в нужном месте текстового поля "произношение" (3) Чтобы доавить правило в словарь, выбранный в данный момент в левой части редактора, нажмите конпку (4) Для добавления собственных правил я рекомендую Вам создать свой словарь (кнопка (5)), а не редактировать скачанный с сайта,чтобы избежать в дальнейшем проблем в случае обновления словарей на сайте, т.к. функций объединения и обновления словарей в редакторе пока что не предусмотренно. Да и после такой коррекции и сохранении в словаре, нужно повторно книгу обрабатывать словарями ударений ? Да. После любого изменения в словарях сохраненные ранее книги в библиотеке нужно загово обработать. 4. Есть ли какой либо "бэкап" своих настроек программы, своих словарей итп. Или в дополнительно папке Users\... \AppData\Roaming\KooDAudio как у меня например нужно сохранять какие либо файлы, или всю папку делать резервную копию. Все пользовательские файлы хранятся в папке профиля. Никаких дополнительных файлов кроме этой папки в бэкапе сохранять не требуется. Некотроая дополниельная информация о папке профиля имеется в справочном файле readme.htm, в разделе "Хранение данных" 5. Если я в разделе Проект - словарный анализ текста, сохраняю слова с измененными ударениями в словаре для замены в конце, как вы и рекомендуете, то как мне правильно например в случае переустановки программы, или еще каких проблем с компом использовать мои сохраненные данные для переноса ну например в обновленную версию, или после обновления ваших словарей, которыми я буду пользоваться ? Назовем это - "правильный Бэкап и обновление данных" Как уже и писал выше, для добавления собственных правил лучше создать отдельный словарь. По поводу переноса данных - все так же как и с бэкапом - все Ваши словари, книги в библиотеке и прочее хранится в папке профиля. 7. При закрытии программы, или ее "вылете" на каком то этапе нужно ли опять проводить довольно длительную процедуру обработки словарями ударений ? Если "подготовка" была зваершена до конца, то обработанный текст хранится в файле проекта, повторно нужно обрабатывать только если набор словарей был изменен. Если же обработка была прервана из-за вылета или закрытия программы, при следующем запуске она будет запущена автоматически. Синтез речи- Управляющие теги ELAN или SSML ? каково их отличие, какой выбрать ? ну никакой информации. Если используете движок "Nicolai", то лучше использовать Теги ELAN. С ними можно более точно управлять параметрами скорости и тембра голоса. Если же используется другой движок, или задействован режим "билингво", то выбора не остается, доступна только разметка SSML/Speech XML. Некоторая информация есть в контекстной справке - нажмите [?] в заголовке окна рядом с кнопкой закрытия, затем на интересующий элемент интерфейса( кнопку/выпадающий список и т.д.)

olelog: Спасибо за оперативный ответ. Во всем разобрался. Еще остается пару вопросов: - При создании собственного словаря ударений и сохранении в нем своих слов, как его лучше обозвать, что бы он работал правильно в порядковой цепочке действующих словарей, и куда лучше поместить, в данном случае у меня в папке DIC имеется папка 1, папка 2, + еще 13 словарей dic - Отладка проекта, предусмотрено ли в программе редактирование текста, как то опечатки, "абраказябры" итп ? по типу исправления и замены как в редакторе блокнота txt ?

MoppoH: обработка идет словарями 01,,,,,,,09 назови его 010 Мой словарь и добавь туда где 13 словарей в отладке проекта не возможно что либо исправить http://koobaudio.borda.ru/?1-3-0-00000047-000-0-0-1420988246 все правки надо делать до добавления книги в режиме редактирования можно как в текстовом редакторе все делать, а так же использовать регулярные выражения для поиска и замены например если в строчке найти написать \bвсе([\,.!?]) то он будет искать только все со знаками препинания, а в строке заменить на написать всё$1, если надо заменить все на всё жмешь заменить и перейти к следующему, если не надо жмешь поиск в перед

olelog: Я не увидел данного редактора в этой программе, и даже начал искать программы для редактирования файлов Fb2, а тут вот оно ! Класс ! "в режиме редактирования можно как в текстовом редакторе все делать, а так же использовать регулярные выражения для поиска и замены например если в строчке найти написать \bвсе([\,.!?]) то он будет искать только все со знаками препинания, а в строке заменить на написать всё$1, если надо заменить все на всё жмешь заменить и перейти к следующему, если не надо жмешь поиск в перед" То, что вы описали выше, есть какие либо шаблоны, правила, программы, и где это взять ( \bвсе([\,.!?]) - всё$1, ) ??? У меня опять в этой связи возник вопрос: попробовал заменить ошибку по всему тексту имя "Стас" прописано везде как "Стае", находит следующее: остается, как видите "Стае" присутствует в словах таких как "остается", замена везде будет неправильной. В этом случае что только вручную прыгать по абзацам ? - Вопрос по словарям ударений: У меня в сборнике книг одного автора встречается имя "Бо", довольно часто, и программа читает это слово очень глухо "Б"почти "П", иногда вообще этого слова не слышно. Как расставить ударение в односложных словах, в редактировании словарей у меня этого не получается. То же касается абревиатур, сокращений, зачастую состоящих из согласных. Например УВД, ГАИ, ФСБ, АКМ итп. Извините за такое колличество вопросов, но я в этом деле пока новичек. Именитые чтецы озвучивают в основном всякую муть, а книг, которые хотелось бы слушать, в озвучке нет. Поэтому решил заняться серьезно вашей программой.

MoppoH: вот тема о регулярных выражениях http://koobaudio.borda.ru/?1-1-0-00000004-000-0-0-1394444958 разобраться самому в принципе не сложно чтобы искало только Стае в верху этого окна есть А=а это функция регистра, то есть будет искать только с большой буквы, так же можно отделить слово \bСтае\b, \b будет показывать только слово Стае целиком, остальные остается или стаевидный будет игнорировать при поиске Николай иногда некоторые сочетания букв читает коряво, например мачтой, а в имени Бо просто добавь еще одну букву Боо и он будет протяжно читать это слово сокращения лично я делаю вот так УВД=УВэДэ<

olelog: Спасибо, все класс, все уже получается. Каждый день открываю для себя все новое в этой программе !

olelog: Подскажите, как отравить изображение с компа, отправляет куда то на.... "Войти в QIP Диск", почему здесь все так сложно ? Блин нарисуйте скрпку, как везде вложить файл и все ! Теперь вопросы еще: почему после обработки словарями ударений у меня получается такая фигня при чтении голосом: "тогда - ТэОгда", Сворачиваемся - эСВорачиваемся, точку - ТэОчку, то- ТэО, только - тэОлько, свои - эСВуои, Активно - АКативно Эта фигня творится после внесения и корректирования в моем словаре аббревиатур и сокращений, типа АК- АКа< АКС- АКээС< При корректировке в моем словаре все равно читает неправильно. Что делать ?

MoppoH: я сначала фотки загружаю на яндекс фотки, а затем код фотки вставляю сюда olelog пишет: Теперь вопросы еще: почему после обработки словарями ударений у меня получается такая фигня при чтении голосом какой голосовой движок, Николай? аббревиатуры ты случайно не со звездочкой написал типа AK*=АКа если были внесены изменения в словари, текст надо заново обработать словарями, чтобы вступили в силу изменения, правой кнопкой на книге

Cminant: Для вставки изображений загрузите их на любой хостинг картинок, например: fastpic.ru, http://radikal.ru, http://imageshack.us и т.д. Затем в коде сообщения на форуме используйте тэг [pre2][img]ссылка-на-картинку[/img][/pre2] ваши скриншоты из имейла: [pre][img]http://i66.fastpic.ru/big/2015/0204/73/8f82b5465b8997d24b44028376624773.png[/img] [img]http://i63.fastpic.ru/big/2015/0204/8b/a03fa5ef3a1cb361c38f1af58a54748b.png[/img] [img]http://i59.fastpic.ru/big/2015/0204/de/54fd8fd72ede39d2ff1c92043b1bc5de.png[/img] [img]http://i63.fastpic.ru/big/2015/0204/35/24010cda6376a081ae7136b54e8f0935.png[/img] [img]http://i68.fastpic.ru/big/2015/0204/94/3889a0e6a38bb43ae14fd4e3fdc2ec94.png[/img][/pre] Касаемо правил автозамены: правило "TO*"=ТэО< у вас заменяет все слова, начинающиеся с "то" : "тогда" "точка" и прочие... Во первых, нужно убрать "звездочку" в конце шаблона, чтобы правило затрагивало только слово "ТО" целиком а не часть слова. Во вторых, поскольку это аббревиатера, в свойствах правила следует включить чувствительность к регистру, дабы не путать ее с частицей "то" Чувствительность переключается кнопкой под шаблоном апрвила то же самое следует применить и ко всем остальным аббревиатурам "СВ*" "АК*" "МВ*" и т.д: убрать звездочки и включить чувствительность к регистру.

smochinin: А можно ли как-то отключить обработку словарями ударений сразу после добавления в библиотеку? И второй вопросБ а можно ли сделать так, чтобы сначала убирались из общего списка слова Excword.txt а потом только сопоставлялись оставшиеся со словарями? и третий вопрос/просьба а можно ли сделать в окне редактора словарей сортировку не только по убыванию длиены слова, но и по возрастанию? (чтобы сначала правились в тексте слова *мещен* а потом, если попадается правило длиннее, типа помещени*, оно бы применялось позже первого)

Cminant: smochinin пишет: А можно ли как-то отключить обработку словарями ударений сразу после добавления в библиотеку? Пока что только если снять галочку "Словари" в окне свойств проекта/импорта в разделе "обработка" smochinin пишет: И второй вопросБ а можно ли сделать так, чтобы сначала убирались из общего списка слова Excword.txt а потом только сопоставлялись оставшиеся со словарями? Для этого есть опция "Статический фильтр" в меню фильтра: https://yadi.sk/i/fZC-KZXEg7rtQ smochinin пишет: и третий вопрос/просьба а можно ли сделать в окне редактора словарей сортировку не только по убыванию длиены слова, но и по возрастанию? (чтобы сначала правились в тексте слова *мещен* а потом, если попадается правило длиннее, типа помещени*, оно бы применялось позже первого) В этом случае правило с шаблоном "помещени*" не будет работать никогда, т.к. *мещен* будет иметь более высокий приоритет и перекроет его в 100% случаев. З.Ы. в принципе добавить обратную сортировку по длинне возможно, просто я лично не вижу смысла...

smochinin: Очень сильно благодарен за исчерпывающий ответ!!! Теперь, значит, можно раздуть из excwords слона и потом заморозить им анализ и всё, кури бамбук - выскочат самые, что ни на есть николаевские ляпсусы. И вправду быстрее анализ пошел. Спасибо ещё раз. А про словари, я просто думал, что и в пределах словаря более низко стоящее слово перекрывает вышестоящиею...



полная версия страницы