Semestr letni 2009/10
Semestr zimowy 2009/10
Semestr letni 2010/11
Eksploracja zasobów internetowych PI_ITI1104
Treści programowe:
1. Eksploracja struktury sieci WWW.
2. Pobieranie i przetwarzanie treści stron WWW.
3. Wyszukiwanie dokumentów WWW bazujące na słowach kluczowych.
4. Ranking wyników na bazie linków.
5. Wstęp do grupowania danych.
6. Grupowanie dokumentów WWW.
7. Tolerancyjne zbiory przybliżone w grupowaniu dokumentów WWW.
8. Podsumowanie.
Efekty kształcenia:
Umiejetnosc zastosowania istniejacych narzedzi do rozwiązywania problemów związanych z eksploracją sieci WWW.
Rodzaj przedmiotu
Koordynatorzy przedmiotu
W cyklu 2010L: | W cyklu 2009L: |
Literatura
a) podstawowa:
1. Zdravko Markov, Daniel T. Larose: Eksploracja zasobów internetowych : analiza struktury, zawartości i użytkowania sieci WWW, Wydawnictwo Naukowe PWN, 2009
2. David Hand, Heikki Mannila, Padhraic Smyth: Eksploracja danych, Wydawnictwa Naukowo-Techniczne, 2005
3. Soumen Chakrabarti, Mining the Web: Discovering Knowledge from Hypertext Data, Morgan Kaufmann 2002
b) uzupełniająca:
1. Bing Liu, Web Data Mining: Exploring Hyperlinks, Contents, and Usage Data, Springer, 2010
2. Ngo Chi Lang, A tolerance rough set approach to clustering web search results, Warsaw University 2003
3. Saso Dzeroski, Nada Lavrac (red.): Relational Data Mining, Springer, Berlin, 2001