Для повышения качества перевода в систему добавлено 3 новых уровня лексического анализа: семантический анализатор падежно-предложных групп, анализатор лексической сочетаемости в рамках одного предложения, определитель значения по тематической принадлежности в границах абзаца и всего текста. Для реализации последнего уровня анализа автоматически формируется динамическая модель предметной области переводимого текста. Это позволяет довольно достоверно переводить тексты с неявно выраженной специализацией (публицистического, научно-популярного информационного характера). Таким образом, система перевода СОКРАТ становится более интеллектуальной и может сама настраиваться на текущую тематику, определяя специфику текста и его фрагментов самостоятельно, с использованием только базового словаря. Существенно улучшены и дополнены базовые словари. Базовые словари по каждому языковому направлению включают более 120 тыс. слов, при этом из словарей исключены около 2 тысяч низкочастотных производных форм (-ing, -ed, -s), транслитерируемых имен и сокращений. Включена дополнительная лексика по искусству, публицистике, геологии, астрономии, авиации, автомобилям, судостроению, металлообработке и смежным тематикам. Описана тематическая принадлежность лексики и проведена соответствующая индексация, что позволило увеличить скорость перевода на 30-50%. Распознавание и транслитерация сокращений, наименований и имен собственных, как включенных в словарь, так и не зарегистрированных в словаре. При переводе с европейских языков (латиница) сохраняется исходная форма слов, перевод с русского языка при отсутствии словарного эквивалента использует правила транслитерации.
Технические требования: PENTIUM-100, 8 Mb RAM, SVGA, CD-ROM, Windows 95.
|