Мы в социальных сетях:

О нас | Помощь | Реклама

© 2008-2025 Фотострана

Реклама
Здесь выдают
ставки
Получить
Поделитесь записью с друзьями
Наука и Техника
Создан алгоритм, который убирает "воду" из текста.

Дипломы спасены!

MetaMind разработала алгоритм на базе нейросетей, который сканирует англоязычный текст и делает из него краткую выжимку. Такие алгоритмы существовали давно, однако в Salesforce заявили, что им удалось сделать прорыв.

Для оценки используется показатель ROUGE, который получается при помощи обработки стандартного массива статей сайтов CNN и Daily Mail. Для этих массивов уже написаны выжимки руками человека, а метод оценки работает так: то, что получилось у алгоритма, сравнивается с «человеческой выжимкой» (в ней ищут упоминания слов и выражений), и оценка показывает то, насколько результат близок к «рукотворному идеалу».

Выжимки создаются двумя способами: убиранием лишних слов из текста или пересказом при помощи введения новых слов (и выражений). Для второго подхода и требуется машинное обучение.

По мнению журналистов из MIT Technology Review, алгоритм Salesforce производит «удивительно связные и точные» выжимки. Например, новость The New York Times длиной в 345 слов превратилась в три предложения из 50 слов.

Источник: metamind
Создан алгоритм, который убирает
Рейтинг записи:
5,5 - 6 отзывов
Нравится6
Поделитесь записью с друзьями
Никто еще не оставил комментариев – станьте первым!
Наверх