Примечание: работа является продолжением темы прошлогодней дипломницы Ольги Шаминой.
Тема работы
Автоматический поиск научных статей в русскоязычном сегменте сети Интернет.
Цель работы
Целью данной работы является построение средства непрерывного автоматического поиска научный статейв сети Интернет.
Данное средство должно представлять собой автономно функционирующего агента, который в начале своей работы получает на вход набор статей или набор URL, а затем непрерывно и автономно осуществляет поиск научных статей путем обхода веб-страниц и посылки запросов к поисковым системам, загрузки статей и извлечения из них новой информации о статьях, авторах, конференциях и т.п., которая может послужить исходными данными для дальнейшего поиска.
В рамках дипломной работы О. Шаминой были созданы отдельны средства, которые позволяют
- осущестлять поиск заданной научной статьи по библиографической ссылке,
- осуществлять поиск конференций и домашних страниц авторов по заданному названию конференции, имени автора.
Данная работа призвана завершить созданные наработки для того, чтобы интегрировать их в единую систему и провести экспериментальное исследование.
План работы
1. Заставить работать все методы, разработанные Шаминой, по отдельности.
2. Доработать реализацию, чтобы она была интегрированным решением с общим пространством данных, а не набором отдельных инструментов.
3. Провести экспериментальные исследования.
4. Провести практическую апробацию.
5. Написать совместно с н.р. статью.
Дмитрий Козлов / Сергей Довгаль, 3 курс, dbms-sem
Модератор: Сотрудники лаборатории
-
- Аспирант
- Сообщения: 179
- Зарегистрирован: 23 сен 2008 01:19 pm