Wikipedysta:Cackoarek/brudnopis: Różnice pomiędzy wersjami
Usunięta treść Dodana treść
referencja do NLP |
m poprawki i uźródłowienie |
||
Linia 19:
}}
Otwarty System Antyplagiatowy (OSA) – jest wytworem polskich naukowców, który powstał w ramach projektu realizowanego przez [[Międzyuniwersyteckie Centrum Informatyzacji]] (MUCI) przy współpracy z [[Instytut_Podstaw_Informatyki_PAN|Instytutem Podstaw Informatyki Polskiej Akademii Nauk]] (IPI PAN)<ref name="osaweb"
==Cechy==
OSA do [[Porównanie|porównania]] tekstów nie korzysta ze standardowych [[algorytm]]ów znajdowania [[Najdłuższy wspólny podciąg|najdłuższych wspólnych podciągów]] znakowych. W silniku systemu zaimplementowano hybrydowe połączenie kilku metod [[Przetwarzanie języka naturalnego|analizy języka naturalnego]] (ang. ''natural language processing'' - NLP). Zbieżność treści jest oceniana z pomocą 5 różnych miar podobieństwa, które nie wymagają użycia oryginalnych treści prac, lecz odpowiednich [[Struktura danych|struktur danych]] przechowującymi częściową informację o tekstach. W konsekwencji:
# Dane na jakich pracuje OSA są szczególnym rodzajem nieodwracalnych [[Funkcja skrótu|skrótów]] - tzn. nie można z nich odtworzyć oryginalnych treści prac.
# Proces porównania skrótów zgromadzonych w [[Baza danych|bazie danych]] jest wystarczający do wskazania zapożyczeń pomiędzy badanymi dokumentami. Podejście to odznacza się lepszą [[Złożoność obliczeniowa|efektywnością]] niż tradycyjne porównywanie oryginalnych tekstów. Dzięki temu uzyskuje się większą odporność na powszechnie stosowane sposoby kamuflażu plagiatowania (przestawianie szyku lub kolejności zdań, stosowanie [[synonim]]ów, podstawienia czcionek lub tworzenia pracy z kilku źródeł)<ref name="krasp">{{Cytuj stronę | url = www.krasp.org.pl/pliki/4d1d1f5cbc504f75485666b0de1e60cf.pdf | tytuł = Konferencja Rektorów Akademickich Szkół Polskich | autor = Marek Kręglewski | data = 2015-05-23 | język = PL | data dostępu = 2015-10-12}}</ref>.
# OSA jest w stanie, poprzez nieodwracalne skróty, utworzyć indeksację dowolnie dużego zbiór prac referencyjnych. Najczęściej są to zbiory dostarczone przez użytkownika w jednym z formatów tekstowych: txt, rtf, pdf, doc, docx, odt.
Linia 30:
==Historia==
Otwarty System Antyplagiatowy powstał jako odpowiedź na coraz bardziej rażące zjawisko [[Plagiat|plagiatowania]] [[Praca dyplomowa|prac dyplomowych]] na polskich uczelniach. Jest rozwijany w ramach projektu realizowanego przez Międzyuniwersyteckie Centrum Informatyzacji (MUCI) działające jako wydzielona jednostka organizacyjna Uniwersytetu im. Adam Mickiewicza w Poznaniu, utworzona z inicjatywy Konferencji Rektorów Uniwersytetów Polskich. MUCI jest finalistą IX edycji konkursu ''Lider Informatyk''i tygodnika Computerworld w kategorii ''organizacje użyteczności publicznej
== Obsługiwane bazy referencyjne ==
Linia 40:
== Najważniejsze funkcjonalności<ref>{{Cytuj stronę | url = http://wiki.osaweb.pl/Strona_g%C5%82%C3%B3wna | tytuł = Wiki projektu OSA | data dostępu = 2015-10-12}}</ref> ==
* Wyszukiwanie zapożyczeń w bazie referencyjnej.
* Wyszukiwanie zapożyczeń w bazie internetowej poprzez NEKST bez przesyłania oryginału pracy poza [[serwer]] uczelni.
Linia 55:
Aktualnie prace trwają nad integracją z:
* Ogólnopolskim Repozytorium Pisemnych Prac Dyplomowych -
* bazą ponad 10 mln artykułów naukowych, książek i czasopism.
|