Wikipedysta:Cackoarek/brudnopis: Różnice pomiędzy wersjami

Usunięta treść Dodana treść
referencja do NLP
m poprawki i uźródłowienie
Linia 19:
}}
 
Otwarty System Antyplagiatowy (OSA) – jest wytworem polskich naukowców, który powstał w ramach projektu realizowanego przez [[Międzyuniwersyteckie Centrum Informatyzacji]] (MUCI) przy współpracy z [[Instytut_Podstaw_Informatyki_PAN|Instytutem Podstaw Informatyki Polskiej Akademii Nauk]] (IPI PAN)<ref name="osaweb">{{cytuj stronę| url =http://www.osaweb.pl | tytuł = Otwarty System Antyplagiatowy| język =pl}}</ref>. Stosowany jest na [[Uczelnia|uczelniach]] w toku przyznawania [[Tytuł zawodowy| tytułów zawodowych]] oraz [[Stopnie naukowe w Polsce|stopni naukowych]] jako narzędzie wspomagające wykrywanie nieuprawnionych zapożyczeń ([[plagiat|plagiatów]]).
 
==Cechy==
OSA do [[Porównanie|porównania]] tekstów nie korzysta ze standardowych [[algorytm]]ów znajdowania [[Najdłuższy wspólny podciąg|najdłuższych wspólnych podciągów]] znakowych. W silniku systemu zaimplementowano hybrydowe połączenie kilku metod [[Przetwarzanie języka naturalnego|analizy języka naturalnego]] (ang. ''natural language processing'' - NLP). Zbieżność treści jest oceniana z pomocą 5 różnych miar podobieństwa, które nie wymagają użycia oryginalnych treści prac, lecz odpowiednich [[Struktura danych|struktur danych]] przechowującymi częściową informację o tekstach. W konsekwencji:
# Dane na jakich pracuje OSA są szczególnym rodzajem nieodwracalnych [[Funkcja skrótu|skrótów]] - tzn. nie można z nich odtworzyć oryginalnych treści prac.
# Proces porównania skrótów zgromadzonych w [[Baza danych|bazie danych]] jest wystarczający do wskazania zapożyczeń pomiędzy badanymi dokumentami. Podejście to odznacza się lepszą [[Złożoność obliczeniowa|efektywnością]] niż tradycyjne porównywanie oryginalnych tekstów. Dzięki temu uzyskuje się większą odporność na powszechnie stosowane sposoby kamuflażu plagiatowania (przestawianie szyku lub kolejności zdań, stosowanie [[synonim]]ów, podstawienia czcionek lub tworzenia pracy z kilku źródeł)<ref name="krasp">{{Cytuj stronę | url = www.krasp.org.pl/pliki/4d1d1f5cbc504f75485666b0de1e60cf.pdf | tytuł = Konferencja Rektorów Akademickich Szkół Polskich | autor = Marek Kręglewski | data = 2015-05-23 | język = PL | data dostępu = 2015-10-12}}</ref>.
# OSA jest w stanie, poprzez nieodwracalne skróty, utworzyć indeksację dowolnie dużego zbiór prac referencyjnych. Najczęściej są to zbiory dostarczone przez użytkownika w jednym z formatów tekstowych: txt, rtf, pdf, doc, docx, odt.
 
Linia 30:
 
==Historia==
Otwarty System Antyplagiatowy powstał jako odpowiedź na coraz bardziej rażące zjawisko [[Plagiat|plagiatowania]] [[Praca dyplomowa|prac dyplomowych]] na polskich uczelniach. Jest rozwijany w ramach projektu realizowanego przez Międzyuniwersyteckie Centrum Informatyzacji (MUCI) działające jako wydzielona jednostka organizacyjna Uniwersytetu im. Adam Mickiewicza w Poznaniu, utworzona z inicjatywy Konferencji Rektorów Uniwersytetów Polskich. MUCI jest finalistą IX edycji konkursu ''Lider Informatyk''i tygodnika Computerworld w kategorii ''organizacje użyteczności publicznej.''<ref>{{Cytuj stronę | url = http://usosownia.uw.edu.pl/node/205 | tytuł = MUCI laureatem konkursu Lider Informatyki tygodnika Computerworld | data dostępu = 2015-10-12}}</ref>. Projekt jest współfinansowany przez uczelnie wchodzące w skład MUCI, które mają wpływ na funkcjonalności systemu<ref>{{Cytuj stronę | url = http://naukawpolsce.pap.pl/aktualnosci/news,404714,polskie-uczelnie-testuja-otwarty-system-antyplagiatowy-osa.html | tytuł = Polskie uczelnie testują Otwarty System Antyplagiatowy OSA | autor = PAP | data dostępu = 2015-10-12}}</ref>. W celu polepszenia efektywności wykrywania zapożyczeń nawiązano współpracę z IPI PAN - właścicielem polskiej [[Semantyka (językoznawstwo)|semantycznej]] [[Wyszukiwarka internetowa NEKST|wyszukiwarki internetowej NEKST]]<ref>{{Cytuj stronę | url = http://www2.ipipan.waw.pl/index.php/pl/instytut/dzialalnosc-naukowa/wspolpraca-z-gospodarka | tytuł = Współpraca z OSA | autor = IPI PAN | data dostępu = 2015-10-12}}</ref>. W konsekwencji uzyskano możliwość analizy antyplagiatowej w bazie ponad 600 mln stron internetowych bez konieczności generowania zapytań do zewnętrznych podmiotów takich jak [[Google]], [[Yahoo]] itp. Pomimo tak wielkiego zbioru referencyjnego, samo wyszukiwanie zapożyczeń trwa najczęściej mniej niż sekundę.
 
== Obsługiwane bazy referencyjne ==
Linia 40:
 
 
== Najważniejsze funkcjonalności<ref>{{Cytuj stronę | url = http://wiki.osaweb.pl/Strona_g%C5%82%C3%B3wna | tytuł = Wiki projektu OSA | data dostępu = 2015-10-12}}</ref> ==
* Wyszukiwanie zapożyczeń w bazie referencyjnej.
* Wyszukiwanie zapożyczeń w bazie internetowej poprzez NEKST bez przesyłania oryginału pracy poza [[serwer]] uczelni.
Linia 55:
 
Aktualnie prace trwają nad integracją z:
* Ogólnopolskim Repozytorium Pisemnych Prac Dyplomowych - dziękibaza któremuprac OSA będzie w stanie wykryć plagiaty między pracami utworzonymi nadyplomowych wszystkich polskich uczelniachuczelni,
* bazą ponad 10 mln artykułów naukowych, książek i czasopism.