Форум » Справочная » Как быстро и качественно подготовить текст » Ответить

Как быстро и качественно подготовить текст

MoppoH: 1 Надо скачать словари Мои словари и excword, эти словари уменьшат поиск новых слов и омографов. (в принципе это не обязательно, но тогда подготовка текста может затянуться) 2 Открываем текст, проверяем его словарями только Римские, Числительные, clean и сохраняем его 3 Открываем окно отладки проекта переходим в режим Отображать обработанный словарями текст проекта, выделяем все и копируем текст создаем новый текстовый файл и вставляем туда скопированный текст 4 Открываем новый созданный файл, открываем панель поиска и замены (бинокль рядом с режимом редактирования) и переходим в Режим отображение текста - редактирование редактируем текст рег выражением - в найти пишем \bвсе([\,.!?]) - в заменить на пишем всё$1 ( это быстрый поиск и замена все со знаками препинания, так как оно может читать в одно и том же месте по разному) если надо заменить на всё жмем кнопку заменить и найти следующее, если не надо жмем поиск в перед 5 После редактирования сохраняем текст в режиме Только чтение проверяем его всеми словарями кроме 09Омографы 6 Ищем в тексте новые слова в настройках выбираем все слова, скрыть имеющиеся в словарях, скрыть имеющиеся в списке исключений (новые слова которые встречаются в тексте 1 раз я даже не проверяю, обычно на книгу 8 часов новых слов получается около 100-150) 7 Открываем Отладку проекта в режиме Отображать обработанный словарями текст проекта и в строку поиска вставляем [more]\b(бега|(за|про|с)бега(в|л)|бедра|беды|белка|белье|берег|берега|берегу|бока|бороды|борозды|бою|бревна|бункера|бытие|вдовы|ведра|веера|века|веку|вертела|весла|ветра|вечера|!вина|виски|воды|возу|войны|войска|волны|ворон|ворона|ворону|вороной|вороном|ворот|ворота|временная|временной|временную|временные|вырезать|главы|глаза|глотка|глотке|глотки|глотку|глоток|глубины|гнезда|года|головы|голоса|города|горе|горы|гребли|грозы|груди|губы|двери|дела|директора|добром|договора|доктора|дома|дорог|дорога|дороги|дорогой|доски|древнее|другом|дружки|дуги|духи|духов|душа|души|дыры|егеря|жара|жаркого|жемчуга|жены|забеги|замка|замке|замки|замку|замков|замком|замок|заморозки|заплачу|заросли|звезды|земли|зеркала|зерна|зимы|змеи|змея|знаком|иглы|избы|игры|катера|качка|качки|качку|кирки|козы|колбасы|колеса|колокола|кольца|копье|копья|корма|короба|коробок|корпуса|косы|красоты|краю|края|крейсера|кружка|купола|лагеря|леса|лесу|лиса|лица|лозы|ловлю|мастера|места|метлы|меха|моря|мука|муку|мытье|начал|начала|начало|небу|ноги|ноздри|номера|норы|ношу|облака|облачка|овцы|озера|окна|округа|округе|ордена|осел|острие|острова|острога|отпуска|отрезать|отсек|паруса|пекло|переходите|петли|печи|письма|плачу|плиты|повара|повести|погреба|поезда|позднее|полосы|поля|поступи|пояса|права|пристань|провода|пропустите|пропуска|проруби|профессора|пугало|пустоты|!пыли|пятна|пяток|ребра|реки|ремесла|рога| рода|родов|роду|руды|ружья|руки|самого|самой|сверла|свечи|свиньи|седла|сектора|села|село|семьи|сердца|сестры|сети|сироты|скалы|скачка|скачки|скачками|скачках|скобы|следа|слез|слезы|слова|слуги|снега|совершенного|совы|сорока|соски|сосны|спины|становитесь|стекла|стены|степи|стоим|стоит|стоите|стоят|стоящий|стопы|сторожа|стороны|страны|стрелка|стрелки|стрелкам|стрелками|стрелку|стрелок|стрелы|стрельбы|строки|счету|судьбы|судьи|суете|суши|счета|тела|тельца|термоса|толпы|тону|тормоза|травы|трактора|треску|тропы|трубы|трусов|трусы|тылу|узнаю|узнают|учителя|хлеба|хлопка|хлопок|ходу|холода|цвета|целую|цены|цепи|цеха|чаек|чайку|частоты|черепа|шторма|щеки|щетины|ядра|яйца|(?-i)Машин|(?-i)Семена)\b[^<][/more] он покажет все Омографы в которых не проставилось ударение (обычно на книгу 8 часов это где то 150-200 омографов) создаем свой словарь и добавляете в свой словарь те омографы которые вы найдете в тексте (в моем словаре 09Омографы большенство их идут в единственном числе, головы<, горы<( исключения глаза<, ру<ки, но<ги, слёзы - они во множественном числе) 8 Выбираем все словари и 09Омографы тоже и проверяем заново текст книги Все текст готов, как показала практика, на книгу 8 часов при прослушивание всего 40-50 слов будет прочитано не правильно, такая обработка текста у меня занимает от 30 до 50 минут, в зависимости от книги.

Ответов - 27, стр: 1 2 All

odinokiyklaus: "Результат обработки словарями" Не нашел такого окна.... "Показать обработанный текст" а это окно где расположено? Не срабатывают правила: и одновременно Почему исчезают точки? как такое может быть?

wasyaka: odinokiyklaus пишет:  цитата: "Результат обработки словарями" Не нашел такого окна....  цитата: "Показать обработанный текст" а это окно где расположено?  цитата: Не срабатывают правила: и одновременно  цитата: Почему исчезают точки? как такое может быть? В поисках рая.. http://shot.qip.ru/00STD0-3768CoQD0/ http://shot.qip.ru/00STD0-5768CoQD1/ click here Как добавить скрин чтобы отображался?

odinokiyklaus: У меня также в режиме "отображать обработанный словарями текст проекта" не отобразились эти точки в конце. В режиме чтения вслух эти точки так же отсутсвуют. Но если посмотреть на текст в режиме разметки TTS, то разметка \pause{150ms}. перед точкой присутствует, а значит эти точки обрабатываются корректно, и на прослушивание в режиме чтения и/или в последующей записи никак не влияют. Видимо небольшой баг.


wasyaka: odinokiyklaus пишет: У меня также в режиме "отображать обработанный словарями текст проекта" не отобразились эти точки в конце. В режиме чтения вслух эти точки так же отсутсвуют. Но если посмотреть на текст в режиме разметки TTS, то разметка \pause{150ms}. перед точкой присутствует, а значит эти точки обрабатываются корректно, и на прослушивание в режиме чтения и/или в последующей записи никак не влияют. Видимо небольшой баг. Спасибо! Для чтения использую MP3book2005 из-за удобства "правки на лету" и им же поиск новых слов. В читалке KooBAudio не понял(сильно и не пытался) как быстро исправить часто встречающуюся ошибку без возврата в окно редактора.

wasyaka: А как такое может быть? начальный текст: И все же что-то его останавливало. все же все же обработанный текст: И все же что-то его останавливало. всё же все же http://shot.qip.ru/00SVMK-4768CoQE0/ Если в словарь добавляю строчку: все же что-то=всё же что-то то срабатывает Нижняя строчка - копия из верхней(и добавлена в словарь) средняя - набрана вручную. Попробовал: в Балаболке - ОК... из 6! ттхт прог только: SynWrite - ОК Книга: Корн 01 Восемнадцать капсул красного цвета

odinokiyklaus: рисунок Для проверки программы я завёл пустую программу и удалил все словари из папок 1, 2 и папки DIС. После в папке DIC завел файл с правилами для проверки - в моём случае он называется Проверка-2.dic, в котором и разместил ваши правила: [pre2] #(([A-Za-zА-яЁё]+)\s\d+)(\r+)=$1. #([A-Za-zА-яЁё]+)(\r+)=$1. все же=всё же [/pre2] как видите из рисунка программа отработала нормально. То есть дело в правилах. Из за них у вас не правильно отработа 3 строчка [pre2] всё же все же [/pre2] То есть в неправильной обработке виноваты правила, а не программа.

wasyaka: odinokiyklaus пишет: То есть в неправильной обработке виноваты правила, а не программа Там была причина в разметке текста в fb2 и не только все ещё нем.два. это за три главы прослушки... А правила : click here 2.1 2.2 2.3 2.4 и папка 2 - второй заход. Словарь ударений в формате pls в виде фонетической транскрипции. Если интересно - дополню(нужен установленный голос Speech2Go IVONA) <lexeme> <grapheme>УСО</grapheme> <phoneme>ˈusˈɛˈo</phoneme> <lexname>макс_prostee</lexname> </lexeme> <lexeme> <grapheme>Уффф</grapheme> <grapheme>уффф</grapheme> <phoneme>ˈufffː</phoneme> <lexname>макс_prostee</lexname> </lexeme> <lexeme> <grapheme>ФБР</grapheme> <phoneme>fɛbɛ ˈɛr</phoneme> <lexname>макс_prostee</lexname> </lexeme> <lexeme> <grapheme>ФЗУ</grapheme> <phoneme>fˈɛzˈɛˈu</phoneme> <lexname>макс_prostee</lexname> </lexeme> Озвучено с помощью 247_S2G_Maxim(2 1.6.74) click here



полная версия страницы