Главная » Windows 7 » Как создать программу словарь. DictMaster - программа составления словарей и работы с ними"Мастер-Словастер"

Как создать программу словарь. DictMaster - программа составления словарей и работы с ними"Мастер-Словастер"

Хотите создать свой собственный словарь для reword? Тогда Вам необходим Компилятор словарей!

Как пользоваться компилятором? (reword compiler)

reword compiler — это программа, с помощью которой можно создавать словари для программы ReWord . Как же это сделать? Очень просто.

Перво-наперво откроем любой текстовый редактор (настойчиво рекомендую использовать Notepad++), создадим новый текстовый файл.

Первой строчкой у нас будет само слово

Второй строчкой у нас будет определение этого слова

Затем необходимо пропустить одну строку и писать уже следующее слово

Таким образом всё будет выглядеть так:

АЗ первая буква алфавита БУКИ вторая буква алфавита ВЕДИ третья буква алфавита

Итак, у нас готов свой небольшой словарь. Теперь нам необходимо сохранить файл на жёсткий диск и запустить программу Reword Compiler.

Нажимаем на кнопку "выбрать файл" и выбираем созданый нами только что файл.

Затем, заполняем поля ниже. В поле "автор(ы) словаря" пишем авторов словаря (например, В. Даль). В поле "полное название словаря" пишем как можно более полное название (например, "большой советский энциклопедический словарь"). В поле "короткое название словаря" пишем его короткое название (например, "энциклопедический словарь"). В поле "символы ввода" записываем сокращенные обозначения наборов символов. Так, для русскоязычных словарей необходимо написать "ru". Если в Вашем словаре встречаются, например, еще и символы латинского (английского) алфавита, то пишем в это поле "ru, en". С символами вывода аналогичная ситуация. В поле "кодировка исходного файла" необходимо указать кодировку созданного Вами файла. Как правило, если Вы не меняли настроек в Notepad++, это будет ANSI. В поле "Ваше имя" вы вписываете Ваше имя. В поле "о словаре" Вы вписываете всю дополнительную информацию, которая, как Вы считаете, является полезной.

Внимание! Из всех полей обязательными для заполнения являются только "выбрать файл", "полное название словаря", "короткое название словаря", "символы ввода" и "кодировка исходного файла".

Как только мы убедились, что все необходимые поля заполнены корректно, мы можем запускать компиляцию, нажав кнопку "компилировать".

В итоге, если всё было сделано верно, программа создаст новый словарь reword и выдаст сообщение о том, что всё готово.

Словарь будет находиться в папке dictionaries, а папка эта находится в рабочей папке reword compiler.

Чтобы увидеть, как работает наш словарь, скопируем файл из папки компилятора dictionaries в папку со словарями программы-словаря reword (тоже dictionaries).

После запуска программы-словаря reword мы видим свой словарь самым первым и радуемся:)

Обязательно необходимо заметить, что определения слов поддерживают базовую разметку HTML.

Создание словарей с мультимедиа

Создавать словари с мультимедиа несложно. Необходимо лишь в определении слова указать с помощью специального обозначения имя файла с мультимедиа. Делается это так:

АЗ первая буква алфавита БУКИ вторая буква алфавита <5>buki.jpg ВЕДИ третья буква алфавита

Как Вы видите, нужно всего-лишь обнести специальным знаком (тегом) название файла, и reword compiler воспримет buki.jpg как файл мультимедиа (рисунок) и включит его в словарь. Необходимо заметить, что для корректного создания словарей с мультимедиа файл с мультимедиа должен находиться в той же папке, что и текстовый файл, указанный в поле "выбрать файл".

Если у Вас есть какие-либо вопросы, связанные с использованием компилятора словарей, задавайте их на страничке "Контакт" . Я Вам обязательно отвечу.

7 различных видов тренировок помогут запомнить слова быстро и менее утомительно чем при обычной зубрежке. Транскрипция, картинки и примеры использования слов увеличат эффективность и ускорят процесс запоминания слов. С каждой тренировкой изменяется уровень изученности пройденных слов.
В список тренировок входят: зрительный поиск подходящего слова и перевода, правильное написание слова, сопоставление слов и переводов, запоминание произношения слов в автоматически меняющихся карточках, в случае если заняты руки (например, за рулем).

Слова

При добавлении нового слова автоматически ищется его перевод, транскрипция, примеры использования и картинки. База слов постоянно пополняется.
Добавлять слова можно через Excel файл (например, полученный из программы Lingvo), либо скачать уже готовые наборы слов из сервера.

Картинки к словам

К словам можно добавлять неограниченное количество картинок. Кроме этого можно добавить фотографию или картинку из устройства (из галереи). Так же с помощью встроенного редактора можно нарисовать свою картинку, либо изменить добавленную фотографию. Данная функция особенно удобна для сложных слов, которые никак не получается изучить, в этом случае зрительная память увеличит эффективность запоминания.

Оповещения

С помощью настраиваемых оповещений вы сможете изучать слова даже не открывая приложения. Просто настройте график прихода оповещений и выберите слова о которых будет вам напоминать ваше устройство. Например вы можете выставить напоминания через каждый час в течении дня с 10 утра до 23 вечера. Если у вас есть "Умные часы" то оповещения будут приходить и на них, что еще больше упростит изучение и повторение слов.

Статистика

У каждого слова есть уровень изученности, меняющийся в зависимости от прохождения как в большую так и в меньшую сторону. С помощью уровня изученности вы сможете узнать какие слова более или менее изучены, скрыть изученные слова, отфильтровать слова по уровню изученности в тренировках и оповещениях (например, повторять только наименее изученные).
Кроме этого в приложении есть статистика тренировок, с помощью которой можно следить за ежедневной активностью прохождения тренировок и количеству изученных слов.

ВВЕДЕНИЕ

Мир все сближается друг с другом политикой мирового общения и культурного обмена многих стран и язык, культура играют большую роль в этом процессе. В настоящее время, каждый человек стремится владеть не только одним иностранным языком, но даже двумя или более. Владение иностранным языком открывает большие перспективы.

Поэтому широкое распространение получают различные языковые курсы, пособия по их изучению, и, конечно, электронные словари. Все словари предлагают пользователям свои ресурсы и функции, которые помогают слушателям повысить уровень владения языком. Но, как говорится в одной русской пословице — «никто не понимает ребенка, как его мать», и является причиной создания данной программы.

УНИВЕРСАЛЬНАЯ ПРОГРАММА ДЛЯ СОЗДАНИЯ СЛОВАРЕЙ И ИЗУЧЕНИЯ

Данная программа является мультиязыковой и предоставляет пользователям возможность создать любой свой собственной словарь и изучать новые слова с помощью слайдера при ее гибкой настройке.

Программа обладает следующими характеристиками:

  • универсальностью: программа позволяет создать любой словарь в зависимости от желания ученика;
  • бесплатностью: программа распространяется бесплатно
  • мультиязычностью: программа поддерживает много языков интерфейса поэтому перевод одного языка интерфейса на другой язык не требует никакого усилия;
  • быстродействием: база данных программы основана на Microsoft Access, что позволяет повысить скорость доступа к данным при большом размере базы;
  • простотой в использования: программа предоставляет простой интерфейс для работы;
  • гибкость настройки: удобство настройки демонстрации слайдов;
  • удобство: программа не требует установки и предоставляет удобный интерфейс;

Программа может выполнять следующие функции:

ü создавать новый словарь;

ü редактировать выделенный словарь;

ü добавлять новое слово по теме;

ü редактировать новое слово по теме;

ü удалять новое слово по теме;

ü показывать в слайде слова по теме;

ü настраивать поля слайда;

ü редактировать тему;

ü настраивать скорость слайда и язык интерфейса.

СТРУКТУРА ПРОГРАММЫ

База данных данной программы находится под управлением Microsoft Access, её структура показана на рисунке 1.

Рис. 1. Схема базы данных

Несмотря на простоту базы данных, она позволяет создать любой словарь и целые темы новых слов. Каждый словарь хранится в таблице и имеет до четырех полей, достаточных для описания любой темы, кроме этого, он обладает некоторыми темами, хранимыми в таблице . Новое слово, помечаемое индексами словаря и темы, помещаются в таблицу .

Программа имеет три формы, которые показаны на рис. 2.

Рис. 2. Структура программы

Все кнопки программы были уменьшены, но снабжены описанием.

ЗАКЛЮЧЕНИЕ

Разработанная программа достаточно проста, но при этом позволяет создать любой словарь. Программа, не может сравниться с программами известных производителей по запасу слов, но она имеет свои определенные особенности и распространяется бесплатно.

Одной из самых полезных программ на ПК и смартфоне в моем понимании является электронный словарь. В те стародавние времена, когда я учил иностранный язык, каждое слово приходилось искать в бумажном словаре. Эту тривиальную операцию я проделывал сотни раз, а некоторые зловредные слова приходилось смотреть снова и снова, так как я успевал забыть их значение. Как это было обидно! То ли дело сейчас, вжух и перевод перед глазами на экране монитора. История поиска, на случай, если искомое слово не перешло из области кратковременной памяти в долгосрочную.



Давайте своими силами создадим электронный словарь для программ StarDict / GoldenDict. Для этого может понадобится много, или мало человеко-часов, в зависимости от качества исходного материала.

Шаг первый: OCR

В отличие от альпинизма при оцифровке словаря самый тяжелый шаг, не последний а первый. Если вам придется проводить OCR бумажного словаря с выцветшими страницами, напечатанного слишком мелко, с различными артефактами небрежного использования, или на экзотическом языке, то даже FineReader не сильно поможет. На некоторых страницах разница в длительности времени между ручным набором текста и OCR с корректировкой ошибок ничтожна.


Советую сохранять все в простых текстовых файлах, так как продвинутый поиск и исправление ошибок, расстановка тэгов, преобразование сортировки и прочие операции с текстовым массивом невообразимо осуществлять с бинарным фалом .


На этом шаге важно определиться со структурой словарных статей. В самом простом случае будет всего два поля: ключ и значение . Этого достаточно, но если нужна подсветка различных элементов статей, то тогда потребуется все такие элементы определенным образом маркировать.


Самое время немного поговорить о форматах. Существует много форматов электронных словарей, вот их список.


Все форматы мы здесь разбирать не будем, так как большинство из них проприетарные. Нас интересуют открытые стандарты и открытое ПО.

Dictd

Возникший в эпоху, когда сетевые TCP/IP протоколы беспрепятственно плодились и размножались dictd сейчас представляет лишь археологический интерес. Это клиент серверный протокол, использующий TCP порт 2628, определен в RFC 2229 .


Исходный файл для словаря форматируется следующим образом.


:статья: объяснение

XDXF

Ну все, завязываем с археологией и переходим к словарным форматам и программам годным для использования IRL.


XDXF имеет все преимущества и недостатки XML формата, каковым и является. Весь синтаксис формата и примеры можно обозреть .


Скелет словарного файла выгладит следующим образом, состоит из 2-х частей: meta_info и lexicon .


Вся информация про словарь: название, автор и пр. статья 1 статья 2 статья 3 статья 4 ...

Тем не менее возможно и кое-какое и разметка файла словаря, однако не идет ни в какое сравнение с XDXF .


a 1\n2\n3 b 4\\5\n6 c 789

Формат определяет символ переноса строки \n , в том случае, когда статья разбита на параграфы.

Шаг второй: корректировка

После первого шага скорее всего будут десятки, а то и сотни орфографических, грамматических и всяких прочих ошибок, странных символов и прочих артефактов OCR.


Особенность словарей в том, что проверка орфографии нужна одновременно по двум языкам. Даже сейчас в 2018-м удивительно мало текстовых редакторов и даже офисных пакетов умеют это нехитрое действие выполнять.



:setlocal spell spelllang=en,ru

для проверки орфографии по двум словарям, в данном случае русском и английском. Далее список граблей.

  • Сортировка текста работает абы как для не латинских локалей, особенно плохо там, где написание буквы требует более одного символа, как армянская ու = ո + ւ . Необходимо в таких случаях самостоятельно сортировать список слов с помощью простенького Perl, или иного скрипта.
  • Поиск по шаблону также может работать неожиданно для некоторых локалей, даже если сам текст и консоль в UTF-8.
  • При оцифровке печатного словаря нужно быть готовым не только к ошибкам оцифровки, но и ошибкам в самом печатном словаре. Их там может содержаться немало!
  • Если название статьи пишется заглавными, то возможно следует перевести при оцифровке в нижний регистр. Не все буквы имеют символы в верхнем регистре, собственно не для всех локалей даже есть верхний регистр.

Шаг третий: компиляция словаря

Для формата XDXF , как уже было сказано, этот шаг не требуется. Просто запихнуть файл в папку /usr/share/goldendict , где программа подхватит его.


Для TSV файла, используется утилита stardict-editor , поставляемого с набором инструментов .



На выходе программа создает следующие файлы, наподобие древнего Dict.

  1. somedict.ifo
  2. somedict.idx либо somedict.idx.gz
  3. somedict.dict либо somedict.dict.dz
  4. somedict.syn (optional)

Файлы копируются в каталог /ysr/share/stardict/dic и на этом все.


P. S. Для мобильной платформы Android программа GoldenDict внезапно стал платной, однако в интернет сети все еще можно найти последнюю бесплатную версию программы.



Предыдущая статья: Следующая статья:

© 2015 .
О сайте | Контакты
| Карта сайта