Компания Explosion AI, специализирующаяся на разработках, связанных с искусственным интеллектом и машинным обучением, представила первый значительный выпуск свободной библиотеки spaCy, в которой воплощены в рабочий код результаты последних достижений в области распознавания текста на естественном языке (NLP, Natural Language Processing). Библиотека написана на языке Cython (расширение Python, позволяющее использовать вставки на языке Си), совместима с CPython 2.6+/3.3+ на платформах Unix/Linux, macOS и Windows, и распространяется под лицензией MIT. Языковые модели пока подготовлены только для английского и немецкого языков (размер каждой модели около 500Мб). Библиотека рассчитана на применение в конечных продуктах, снабжена исчерпывающей документацией и предоставляет целостный API, для которого гарантируется обратная совместимость. Большинство имеющихся разработок в области NLP представляют собой исследовательские проекты, реализующие сразу несколько альтернативных алгоритмов, но не готовые для поставки
После трёх лет разработки и после более 10 лет развития ветки 7.x состоялся релиз текстового редактора Vim 8.0. Код Vim распространяется под собственной копилефт лицензией, совместимой с GPL, и позволяющей без ограничений использовать, распространять и перерабатывать код. Основная особенность лицензии Vim связана с возвратом изменений - реализованные в сторонних продуктах улучшения должны быть переданы в исходный проект, если мэйнтейнер Vim посчитает эти улучшения заслуживающими внимания и отправит соответствующий запрос. По типу распространения, Vim относится к Сharityware, т.е. вместо продажи программы или сбора пожертвований на нужды проекта, авторы Vim просят перечислить любую сумму на благотворительность, если программа понравится пользователю. Основные новшества: Поддержка асинхронного ввода/вывода и каналов, позволяющих обмениваться сообщениями с другими процессами в фоновом режиме, что даёт возможность отправлять задания отдельным серверным обработчикам и принимать результаты не прерывая работу
В рамках проекта Magic Book Creator разрабатывается свободная интегрированная среда, рассчитанная на написание книг в Linux. Magic Book Creator делает процесс создания книг более простым и приятным, что может способствовать привлечению писателей на платформу Linux и улучшению качества электронных книг. Для ускорения разработки автор проекта готов работать над Magic Book Creator в режиме полного рабочего дня, но для этого требуется финансирование. К сожалению, существующее программное обеспечение для писателей не даёт возможности одновременно иметь под рукой текстовый редактор и необходимые рабочие материалы, включая доступ к сетевым сервисам заметок и хранилищам, таким, как Evernote, Pocket, Dropbox и MEGA. Magic Book Creator задуман, как гибкий, расширяемый модулями, программный комплекс с открытым API для писателей, издателей электронных книг и блогеров, объединяющий в единой гибкой и расширяемой среде всё необходимое, и свободно распространяемый под лицензией GPL. Запланированные возможности: Общие
Ричард Столлман выступил с предложением снабдить текстовый редактор Emacs возможностями полноценного текстового процессора, поддерживающего визуальное редактирование документов в режиме WYSIWYG. По словам Столлмана, он планировал добавление режима WYSIWYG ещё 25 лет назад и для этого уже подготовлен начальный базис в форме поддержки свойств текста и шрифтов со знаками переменной ширины. Для хранения документов предложено обеспечить поддержку форматов HTML и ODF, а также, возможно, формата Texinfo. Кроме непосредственной переработки Emacs в обсуждении также рассматривается вариант создания на базе Emacs дополнения к LibreOffice с поддержкой Lisp/Scheme, но Столлман пессимистично отнёсся к данной идее. По мнению Столлмана WYSISYG-режим в Emacs не должен быть перегружен возможностями, достаточно позволить использовать шрифтовое оформление и простейшую разметку, дающую возможность создавать документы, подобные ebooks.pdf. Для создания таких документов приходится использовать LibreOffice или TeX, но
После четырёх лет разработки представлен релиз новой стабильной ветки свободного многоплатформенного текстового процессора AbiWord 3.0. Выпуск пока доступен только в исходных текстах (лицензия GPL), бинарные сборки находятся в процессе формирования. Кроме типичных средств по обработке документов в распространённых офисных форматах (ODF, OOXML, RTF и т.п.), AbiWord предоставляет такие расширенные возможности, как организация совместного редактирования документов и многостраничный режим, позволяющий на одном экране просматривать и редактировать разные страницы документа. Среди добавленных улучшений: Переход к использованию тулкита GTK+3. Интерфейс портирован для использования возможностей GTK+3, но поддержка сборки с GTK2+ сохранена (при сборке следует указать "--with-gtk2"). Минимально поддерживаемая версия GTK+ поднята до 2.12.0; Возможность определения границ вокруг параграфа с заливкой фона определённым цветом. Для управления выделением параграфов реализован новый диалог "Borders and Shading";
Группа исследователей из нескольких европейских университетов опубликовала свои наработки в области автоматизированной оценки авторства текста на основе статистического анализа предыдущих работ. Система требует предварительного обучения для накопления статистических данных, т.е. после анализа точно принадлежащих автору работ позволяет в дальнейшем оценить является ли лицо автором произвольного текста. Код проекта написан на языке С++ и открыт под лицензией GPLv2. Дополнительно доступна статья с изложением используемого в приложении математического аппарата. Изначально проект был нацелен на решение задачи определения авторства исторических документов, сведения об авторах которых утеряны или поставлены под сомнение. Тем не менее, у разработки имеются большие перспективы при решении современных задач, от определения авторства электронных писем, анонимных обращений к правоохранительным органам и заметок в блогах, до выявления плагиата в научных и художественных публикациях, организации новых систем поиска в
Представлен первый релиз новой стабильной ветки текстового редактора GNU/Emacs 24.1. Среди наиболее интересных улучшений: Новая встроенная система работы с пакетами и интерфейс для загрузки и установки дополнений. Проектом GNU и разработчиками Emacs введён в строй новый архив пакетов с дополнениями; Поддержка двунаправленного текста при просмотре и редактировании документов, в том числе поддержка языков с начертанием справа налево, таких как арабский и иврит. Поддержка лексического контекста в Emacs Lisp; Улучшение механизмов подключения кастомизированных визуальных тем; Улучшенная и унифицированная система автоматического дополнения, работающая в различных режимах и дополнениях; Обеспечена поддержка GnuTLS (для встроенного шифрования TLS/SSL), GTK+ 3, ImageMagick, SELinux и Libxml2.
Доступен релиз ReText 3.0.0, специализированного редактора для языков разметки Markdown и ReStructuredText. ReText может быть использован как для профессиональной вёрстки документов, так и как легковесная альтернатива традиционным офисным пакетам. ReText написан на языке Python с использованием библиотеки Qt. Основные возможности ReText: Полная поддержка Markdown и ReST, а также расширений Markdown; Поддержка вкладок и двухпанельного редактирования ("Live Preview"); Экспорт в форматы HTML, PDF и ODT; Встроенный генератор веб-страниц; Загрузка файлов в Google Docs; Возможность автоматического сохранения файлов; Поддержка CSS-стилей; Подсветка синтаксиса; Быстрая вставка тегов и символов HTML. Основные изменения в новой версии: Поддержка Python 3.x; Улучшенная подсветка синтаксиса и проверка орфографии; Export Extensions — возможность задавать свои собственные форматы экспорта при помощи desktop-файлов; Раздел меню «недавние файлы»; Поддержка CSS-стилей для
Издание New York Times открыло под лицензией GPLv2 интересный JavaScript-модуль Ice.js, позволяющий обеспечить отслеживание изменений в любых формах редактирования. Ice.js поддерживает отслеживание изменений сразу от нескольких пользователей и даёт возможность наглядно отображать внесённые в текст правки, используя выделение цветом. Модуль легко может быть интегрирован в любой web-проект, готовые плагины подготовлены для online-редактора TinyMCE и CMS WordPress. Для оценки работы Ice.js подготовлена специальная демонстрационная страница.
Представлен релиз GNU ed 1.6, реализации от проекта GNU первого классического текстового редактора Unix, некоторые идеи которого послужили основой для формирования командного интерфейса текстового редактора vi и потокового редактора sed. В настоящее время редактор ed в основном используется для автоматизации операций построчного редактирования текста из скриптов. В новой версии реализована возможность использования символов с нулевым кодом (NULL) в регулярных выражениях и отображения NULL-символов при использовании команды "l". Флаг "modified" теперь устанавливается при чтении непустого файла в пустой буфер. Перед чтением новой команды ed теперь сбрасывает буферы для потоков stdout/stderr. Для генерации man-руководства задействована утилита "help2man", в руководстве теперь отражены все опции командной строки.