Seminarium Zakładu Logiki Matematycznej
Our seminar is usually held in Polish (except foreign guests). You are welcome every Friday at 14:15, room 5820 (the building of the Faculty of Mathematics, Informatics and Mechanics, Banacha St. 2, Warsaw).
Seminarium Zakładu Logiki Matematycznej odbywa się (poza sytuacjami wyjątkowymi) w piątki w godzinach 14:15-16:00 w sali 5820.
Zawiadomienia o seminariach rozsyłane są również e-mailem.
Osoby, które chciałyby takie zawiadomienia otrzymywać,
proszone są o kontakt z opiekunem strony:
Inne seminaria Wydziału MIM UW.
The next seminar:
Najbliższe seminarium odbędzie się 12.12.2008 o 14:15 (sala 5820).
Kolejne planowane seminaria:
Poprzednie seminaria:
Archiwum z roku 2007/08, 2006/07, 2005/06, 2004/05, 2003/04, 2002/03, 2001/02.
3.10.2008 - Marcin Wojnarski: "Prezentacja platformy Debellor".
Debellor jest platformą open-source integrującą biblioteki eksploracji danych i umożliwiającą wykorzystanie wielu z nich w eksperymentach. Obecnie zawiera m.in. biblioteki Weka i RSESLib.
Adres:
www.debellor.org
10.10.2008 - Dominik Ślęzak: "Open Source Edition of Infobright's Data Warehouse".
The theory of rough sets provides a powerful model for representation of
patterns and dependencies, applicable both in databases and data mining.
On the one hand, although there are numerous rough set applications to
data mining and knowledge discovery, the usage of rough sets inside the
database engines is still quite an uncharted territory. On the other
hand, however, this situation is not so exceptional given that even the
most well-known paradigms of machine learning, soft computing,
artificial intelligence, and approximate reasoning are still waiting for
more recognition in the database research.
Rough set-based algorithms and similar techniques can be applied to
improve database performance in several ways. We focus on the idea of
using available information to calculate rough approximations of data
needed to resolve queries and to assist the database engine in accessing
relevant data. We partition data onto rough rows, each consisting of 64K
of original rows. We automatically label rough rows with compact
information about their values on data columns, often involving
multi-column and multi-table relationships. One may say that we create
new information systems where objects correspond to rough rows and
attributes - to various flavors of rough information.
In this talk, we show how the above ideas guided us toward implementing
the fully functional data warehouse product, with interfaces provided
via integration with MySQL and internals based on the newest database
trends. Thanks to compact, flexible rough information, we became
especially competitive in the field of analytical data warehouses, where
users want to query terabytes of data in a complex, dynamically changing
way. Recently, we announced at www.infobright.org the open source
edition of our data warehouse, ready for free usage and further
extensions. In the talk, we illustrate the best scenarios of applying
our software to various aspects of data processing. We also discuss the
most promising directions for further improvement of our technology,
with a special attention to the ideas based on the theory of rough sets
and corresponding techniques.
17.10.2008 - Andrzej Janusz: "Podobieństwo złożonych obiektów zmieniających się w czasie".
Tematem wystapienia jest podobienstwo zlozonych obiektow. Obiekty tego typu bardzo czesto zmieniaja sie w czasie a do opisu ich zmian wykorzystuje sie szeregi czasowe. W czasie prezentacji opowiem o pojeciu podobienstwa - jego wlasnosciach i zastosowaniach. Porusze rowniez temat szeregow czasowych, koncentrujac sie na sposobach wykorzystania pojecia podobienstwa w analizie danych temporalnych. Przedstawie rozne metody reprezentacji szeregow czasowych takie jak SAX, TSB, czy clipping. Za punkt wyjscia potraktuje wybrane prace Eamonna Keogh dotyczace tego tematu.
7.11.2008 - Agnieszka Nowak: "Optymalizacja procesów wnioskowania dla złożonych baz wiedzy".
W referacie chciałabym przedstawić koncepcję optymalizacji procesów
wnioskowania dla systemów o złożonych dziedzinowych bazach wiedzy.
Optymalizacja jest możliwa dzięki zmianie struktury bazy wiedzy na strukturę
hierarchiczną, w której reguły podobne do siebie tworzą skupienia. Do budowy
złożonej bazy wiedzy zaproponowano klasyczny algorytm aglomeracyjny (AHC)
lub jego modyfikację (mAHC), której rezultatem jest zbiór skupień reguł
będący strukturą optymalną z punktu widzenia kryterium separowalności grup.
Efektywne przeszukiwanie złożonej bazy wiedzy (wzorowane na przeszukiwaniu
połówkowym, dającym mniejszą złożoność obliczeniową w stosunku do
przeszukiwania zbioru nie uporządkowanego) i wnioskowanie jedynie na
wybranej (najbardziej relewantnej) grupie reguł pozwala na optymalizację
procesu wnioskowania.
Eksperymenty wykonane w ramach prowadzonych badań wykazały, iż im więcej
reguł w bazie wiedzy, tym mniejszy procent bazy wiedzy jest faktycznie
przeszukiwany. Dla dużych rzeczywistych baz wiedzy w procesie wnioskowania
analizowano jedynie 2-5 % wszystkich reguł przy utrzymaniu pełnej
dokładności wyszukiwania realizowanego przez interpreter reguł w maszynie
wnioskującej.
7.11.2008 - Marcin Kowalski: "Wykorzystanie metod grupowania on-line w optymalizacji silnika bazodanowego".
W trakcie wystpienia chciałbym omówić zagadnienie grupowania danych
ładowanych do relacyjnej bazy danych. Takie dane są zwykle ładowane wiersz
po wierszu w kolejności jaką determinuje żródło danych. Ponieważ standard
języka SQL nie zakłada istnienia w tabeli porządku na wierszach, odpowiedni
sposób ich grupowania i przechowywania w bazie może stanowić czynnik
poprawiający wydajność bazy. Zakładamy jednak, że algorytmy takiego
grupowania powinny wykonywać się w czasie rzeczywistym, by mogły być
stosowane np. dla dużych danych strumieniowych (np. danych transakcyjnych).
Celem projektu, którym chciałbym się zająć jest grupowanie danych tak by m.
in. przyspieszyć wykonanie zapytań języka SQL skierowanych do bazy danych.
Na przykładzie bazy Infobright chciałbym omówić wpływ jaki może mieć
odpowiednie pogrupowanie danych wykorzystujące unikalność zastosowanych w
silniku metod na jej efektywność.
Krótko omówię problemy pokrewne temu zagadnieniu i na ich podstawie jego
osobliwość. Chciałbym również opisać rozwiązania, które są w tej chwili
rozwijane oraz omówić przyszłe kierunki mojej pracy badawczej w tej
dziedzinie.
14.11.2008 - Wojciech Jaworski: "Oparta na ontologii eksploracja danych reprezentowanych za pomocą języka naturalnego".
Upowszechnienie komputerowych metod przetwarzania informacji, a zwłaszcza
komputeryzacja zasobów wiedzy, doprowadziły do powstania bogatych korpusów
tekstów.
Aby korzystać z takich zbiorów dokumentów, potrzebny jest precyzyjny
mechanizm pozwalający pobrać potrzebne w określonej sytuacji dane.
Poszukiwane są nie tylko informacje zlokalizowane w pojedynczych dokumentach
lecz również te, które są rozproszone po całym korpusie. Zapytania zaś mogą
dotyczyć zarówno konkretnych faktów zawartych w tekstach, jak i ogólnych
praw rządzących tymi faktami. Prawa te, jak każda generalizacja, będą
prawdziwe jedynie w pewnym procencie przypadków, którego wielkość trzeba
oszacować.
W referacie przedstawię metodologię realizującą powyższą funkcjonalność dla
zbiorów tekstów o ograniczonej dziedzinie tematycznej.
21.11.2008 - Jan Bazan: "Automatyczne planowanie zachowania obiektów złożonych w systemie Rough ICE".
W referacie chciałbym przedstawić jak można zastosować system Rough ICE
(Rough Set Interactive Classification Engine) do automatycznego planowania
zachowania obiektów złożonych.
Wcześniejsza wersja tego systemu była prezentowana pod nazwą RS-Ecca. Jest
to system wyposażony w graficzny interfejs użytkownika napisany w Javie przy
użyciu bibliotek Swing i JGraph, umożliwiający łatwą realizację różnych
operacji na zbiorach danych i wiedzy dziedzinowej, dotyczących aproksymacji
złożonych pojęć. Głównym celem referatu jest zademonstrowanie działania
systemu przy wspomaganiu planowania leczenia niewydolności oddechowej
28.11.2008 - Zbigniew Suraj: "Odkrywanie modeli systemów procesów współbieżnych z danych eksperymentalnych".
Odkrywanie niejawnych relacji pomiędzy danymi, a także pomiędzy ich ukrytymi modelami jest jednym z głównych zadań
uczenia maszynowego. Dane są często generowane przez procesy współbieżne. Odkrywanie zatem modeli systemów procesów
współbieżnych generujących te dane może często prowadzić do lepszego rozumienia złożonej natury zjawisk i procesów fizycznych.
Głównym celem referatu jest przedstawienie dotychczasowych wyników badań dotyczących automatyzowanego odkrywania
modeli systemów procesów współbieżnych z tablic danych eksperymentalnych, a także zarysowanie nowych problemów badawczych
wraz z pewnymi sugestiami próby ich rozwiązania. Prezentowane podejście jest oparte na teorii zbiorów przybliżonych i teorii
współbieżności. Badania tego typu zostały zapoczątkowane przez Profesora Z. Pawlaka w 1992 roku, a następnie
kontynuowane w kilku ośrodkach naukowych w kraju i za granicą.
Rozważany problem badawczy jest nie tylko interesujący ze względów poznawczych, lecz przede wszystkim z uwagi
na jego potencjalnie duże możliwości aplikacyjne. Metody odkrywania modeli systemów procesów współbieżnych z danych
eksperymentalnych mogą znaleźć zastosowanie w wielu obszarach sztucznej inteligencji, sterowania, biologii molekularnej, medycyny, itp.
5.12.2008 - Sebastian Stawicki: "Wprowadzenie do eksploracji procesów (process mining)".
Pod pojęciem procesu rozumiemy występującą naturalnie lub zaprojektowaną sekwencję zmian właściwości (atrybutów) pewnego systemu lub obiektu. Można powiedzieć bardziej formalnie, że każdy proces jest reprezentowany poprzez trajektorię w przestrzeni fazowej rozpatrywanego systemu. Możemy pod tym pojęciem rozumieć zarówno instancję programu wykonywaną pod nadzorem systemu operacyjnego, jak również pracę programisty uczestniczącego w projekcie lub organizację przepływu dokumentów w jakiejś firmie lub przedsiębiorstwie. Prezentacja będzie miała na celu wprowadzenie do zagadnienia eksploracji procesów (ang. process mining). Mówiąc bardzo oględnie - jest to ogół technik mających na celu odkrywanie i analizę procesów na podstawie dzienników zdarzeń (ang. event logs).