Internet Портал МЭИ(ТУ)
Сентябрь 2018
Пн Вт Ср Чт Пт Сб Вс
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30

Материалы к публикациям

Экспериментальное исследование методов выявления нечетких дубликатов научных публикаций

Доступна выборка из 150 пар документов и оценки трех экспертов («0» — статьи не являются дубликатами, «1» — статьи являются нечеткими дубликатами). Выборка разбита на три меньших по 50 пар в каждой для удобства обучения и экзаменации. Данные представлены в формате CSV и продублированы в формате Microsoft Excel (XSLX), причем в последнем схожие фрагменты текста выделены цветом. Источник заголовков и библиографических описаний — открытые данные eLibrary.

Указание на статьи, проверка полных текстов которых выявила полную идентичность, можно получить по запросу у В. О. Толчеева.

Экспериментальное исследование методов классификации двуязычных текстовых документов

Доступна выборка из 2880 пар документов. Выборка представляет собой набор файлов формата *.txt, содержащих двуязычные библиографические описания (БО) научных статей на темы Computer Science, Психология и Право. Каждый документ представлен двумя файлами - библиографическим описанием на русском и английском языке. Каждый файл содержит три строки - название статьи, ключевые слова и аннотацию. Источник библиографических описаний — открытые данные eLibrary и других научных журналов

 

Вход для преподавателей



Мы находимся:
МЭИ, корпус М, 3-й этаж.
Телефон: (+7 495) 362-74-07
Кафедра управления и информатики МЭИ
Сайт создан и поддерживается лабораторией интеллектуальных информационных систем (ЛИИС) УиИ