Internet Портал МЭИ(ТУ)
Февраль 2018
Пн Вт Ср Чт Пт Сб Вс
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28

Материалы к публикациям

Экспериментальное исследование методов выявления нечетких дубликатов научных публикаций

Доступна выборка из 150 пар документов и оценки трех экспертов («0» — статьи не являются дубликатами, «1» — статьи являются нечеткими дубликатами). Выборка разбита на три меньших по 50 пар в каждой для удобства обучения и экзаменации. Данные представлены в формате CSV и продублированы в формате Microsoft Excel (XSLX), причем в последнем схожие фрагменты текста выделены цветом. Источник заголовков и библиографических описаний — открытые данные eLibrary.

Указание на статьи, проверка полных текстов которых выявила полную идентичность, можно получить по запросу у В. О. Толчеева.

Экспериментальное исследование методов классификации двуязычных текстовых документов

Доступна выборка из 2880 пар документов. Выборка представляет собой набор файлов формата *.txt, содержащих двуязычные библиографические описания (БО) научных статей на темы Computer Science, Психология и Право. Каждый документ представлен двумя файлами - библиографическим описанием на русском и английском языке. Каждый файл содержит три строки - название статьи, ключевые слова и аннотацию. Источник библиографических описаний — открытые данные eLibrary и других научных журналов

 

Вход для преподавателей



Мы находимся:
МЭИ, корпус М, 3-й этаж.
Телефон: (+7 495) 362-74-07
Кафедра управления и информатики МЭИ
Сайт создан и поддерживается лабораторией интеллектуальных информационных систем (ЛИИС) УиИ