Otwarty System Antyplagiatowy: Różnice pomiędzy wersjami

[wersja nieprzejrzana][wersja przejrzana]
Usunięta treść Dodana treść
m MalarzBOT: korekta wielkości nagłówków
m wikizacja, drobne redakcyjne, drobne merytoryczne
Linia 19:
}}
 
'''OSA''' (Otwarty System Antyplagiatowy) jest polskim systemem antyplagiatowym, który powstał w ramach projektu realizowanego przez [[konsorcjum]] [[Międzyuniwersyteckie Centrum Informatyzacji]] (MUCI) przy współpracy z [[Instytut_Podstaw_Informatyki_PAN|Instytutem Podstaw Informatyki Polskiej Akademii Nauk]] (IPI PAN)<ref name="osaweb">{{cytuj stronę| url =http://www.osaweb.pl | tytuł = Otwarty System Antyplagiatowy| język =pl}}</ref>. Stosowany jest na wyższych [[Uczelnia|uczelniach]] w toku przyznawania [[Stopnie naukowe w Polsce|stopni naukowych]] jako narzędzie wskazujące nieuprawnione zapożyczenia w parcy ([[plagiat]]).
 
==Cechy==
System OSA, do [[Porównanie|porównania]] tekstów, nie korzysta bezpośrednio z oryginalnej ich postaci, lecz ze [[Struktura danych|struktur danych]] przechowującymi częściową informację o tekstach. Są to tzw. [[Term frequency|wektory częstości]] i mapy. Takie podejście ma trzy zasadnicze zalety.
# Z bazy tych struktur nie można odtworzyć żadnego z tekstów, który posłużył do jej utworzenia.
# Porównanie map w bazie wystarcza do wskazania zapożyczeń między badanymi pracami ze znacznie lepszą [[Złożoność obliczeniowa|efektywnością]] niż porównanie oryginalnych tekstów jeden do jednego. Przeprowadzone dotychczas testyTesty wykazały wielką odporność systemu na wszelkie, znane jego autorom, metody kamuflażu nieuprawnionych zapożyczeń (zmiana szyku, przestawianie zdań, zastąpienie części słów ich [[Synonim|synonimami]], kompilacja z wielu źródeł, podstawienia czcionek).
# Jest możliwość indeksacji wielkich baz prac referencyjnych (np. [[Ogólnopolskie Repozytorium Pisemnych Prac Dyplomowych|ORPPD]]) poprzez wektory częstości lub inne skróty nieodwracalne.
Tworzenie i aktualizacja bazy map ‒ oraz innych baz niezbędnych do funkcjonowania systemu ‒ jest w pełni zautomatyzowane i odbywa się na podstawie przetworzenia wskazanych przez użytkownika plików zapisanych w jednym z następujących formatów zapisu tekstu: txt, pdf, doc, docx, odt, rtf. Dodatkowo w ramach jednej Uczelni system OSA umożliwia dokładniejsze przyjrzenie się oryginałom prac, w odniesieniu do których stwierdził zbyt wysoki poziom podobieństwa ich map. Tekst badanej pracy można porównać, jeden do jednego, z oryginalnym tekstem każdej z podzbioru prac referencyjnych i polskojęzycznych stron internetowych wyselekcjonowanych przez system na bazie podobieństwa map. Zwykle jest to podzbiór pusty lub kilkuelementowy.
 
==Historia==
OSA powstała w ramach projektu realizowanego przez Międzyuniwersyteckie Centrum Informatyzacji (MUCI) przy współpracy z Instytutem Podstaw Informatyki Polskiej Akademii Nauk, jako odpowiedź na rosnące zjawisko [[Plagiat|plagiatowania]] [[Praca dyplomowa|prac dyplomowych]]. Na polskim rynku istnieje już kilka rozwiązań, które pozwalają weryfikować jakość pracy pod kątem jej [[Oryginalność_dzieła_naukowego|oryginalności]]. Autorzy systemu OSA proponują kolejne narzędzie, którego filozofia działania odbiega od pozostałych rozwiązań. Ideą powstawania OSY jest współfinansowanie projektu przez uczelnie wchodzące w skład MUCI. W pewnym sensie uczelnia taka staje się właścicielem OSY i ma wpływ na to jak będą kształtować się prace nad finalnym produktem.
 
==Obsługiwane bazy==
OSA współpracuje z następującymi bazami:
* Uczelniane repozytorium prac dyplomowych (importowane np. z APD - [[Uniwersytecki System Obsługi Studiów|USOS]])
* Uczelniane repozytorium prac zaliczeniowych (tworzone w systemie OSA przez studentów i promotorów)
* Baza ponad 600 mln dokumentów internetowych zebranych przez wyszukiwarkę Nekst
* Baza aktów prawnych (zebranych przez Nekst[[Wyszukiwarka internetowa NEKST|NEKST]] na stronach ministerstwa)
 
Aktualnie pracujemyprace trwają nad integracją z:
* [[Ogólnopolskie Repozytorium Pisemnych Prac Dyplomowych|ORPPD]]
* Bazą 10 mln artykułów naukowych, książek i czasopism
<!-- * Polskimi biblioteki cyfrowymi -->
 
==Wydania<ref name="osaweb">{{cytuj stronę| url =http://wiki.osaweb.pl | tytuł = Baza Wiedzy - Otwarty System Antyplagiatowy| język =pl}}</ref>.==
Linia 47 ⟶ 46:
(03.09.2015, wersja produkcyjna, stabilna)
* Pominięcie walidacji typu pracy dla prac przesłanych z USOS'a
* Widoki [[Szczegółowe porównanie|szczegółowego porównania]] oraz [[Ujednolicone szczegółowe porównanie|ujednoliconego szczegółowego porównania]] są odporne na treści prac zawierające kod html
 
===Wersja 3.3.2===
Linia 59 ⟶ 58:
===Wersja 3.3===
(24.07.2015, wersja produkcyjna, stabilna)
* OSA nie wysyła do [[SystemWyszukiwarka internetowa NEKST|NEKST]] oryginałów prac (wstępne przetwarzanie pracy przeniesione do uczelnianej OSY lokalnej)
* Ulepszony algorytm ekstrakcji słów z tekstu
* Reorganizacja interfejsu
Linia 68 ⟶ 67:
(06.07.2015, wersja produkcyjna, stabilna)
* Obsługa plików z rozszerzeniem rar oraz tar podczas dodawania dokumentów do kolekcji,
* Możliwość [[Import_prac_z_pliku_archiwum|importu prac z archiwum]] plikowego do OSY (funkcjonalność potrzebna dla uczelni nie posiadających USOSa)
 
===Wersja 3.2===
(26.06.2015, wersja produkcyjna, stabilna)
* Rozbudowana integracja z protokołem [[LDAP]] (w tym także systemem Active Directory)
* [[Ujednolicone szczegółowe porównanie|Ujednolicony widok szczegółowego porównania]] (wszystkie zapożyczenia z wielu prac na jednej stronie)
* Raport z linkiem do szczegółów pracy
* Usprawnienia funkcjonalności zgłoszone przez użytkowników
Linia 88 ⟶ 87:
*Dodanie funkcjonalności kolekcji
*Ulepszone kolorowanie tekstu
*Wykonywanie szczegółowego porównania dla dokumentów z internetu na maszynie OSY (nie wymaga wysyłania tekstu pracy) - a nie na maszynie [[System_NEKSTWyszukiwarka internetowa NEKST|NEKST]]
*Rozpoznawanie w tekście liczb arabskich oraz rzymskich
 
Linia 108 ⟶ 107:
*Podstawowe funkcje manipulacji dokumentami (dodaj, usuń, zatwierdź, ...)
*Wyszukiwanie plagiatów w bazie referencyjnej
*Wyszukiwanie plagiatów w bazie internetowej poprzez [[System_NEKST|NEKST]]
*Wyliczanie statystyk antyplagiatowych
*Generowanie raportu w pdf
*Podstawowa integracja z [[CAS]] i [[LDAP]]
*Obsługa kolekcji
*Szyfrowane połączenie z [[System_NEKST|NEKST]]
*Import masowy plików archiwum
*Obsługa wielu typów plików (pdf, doc, docx, rtf, txt, odt)
 
==Zobacz też==
* [[Plagiat]]
==Bibliografia==
* [[Autoplagiat]]
 
==Publikacje==
 
* [1] Marek Kowalski, Imitacjai ignorancja, Zeszyty Naukowe Politechniki Rzeszowskiej, vol. 15, pp. 69 – 74, 2008.
* [2] Salha Alzahrani, Naomie Salim, Ajith Abraham Understanding plagiarism linguistic patterns textual features and detection methods, IEEE TRANSACTIONS ON SYSTEMS, MAN, AND CYBERNETICS—PART C: APPLICATIONS AND REVIEWS, VOL. XX, NO. XX , pp. 1 – 17, 2011.
* [3] Marek Kowalski, Marek Szczepański, Akademicka przestępczość w cyberprzestrzeni, in Brunon Hołyst, Jacek Pomykała (eds.) Cyberprzestępczość i ochrona informacji, pp. 113 – 126, ISBN 978-83-7520-076-8, 2011.
* in Brunon Hołyst, Jacek Pomykała (eds.) Cyberprzestępczość i ochrona informacji, pp. 113 – 126, ISBN 978-83-7520-076-8, 2011.
* [4] Marek Szczepański, Metody porównywania tekstów – analiza częstościowa, in Brunon Hołyst, Jacek Pomykała (eds.) Cyberprzestępczość i ochrona informacji. Bezpieczeństwo w Internecie. Vol II, pp. 329 – 347, ISBN 978-83-7520-131-4, 2013.
* [5] Marek Szczepański, Algorytmy klasyfikacji tekstów i ich wykorzystanie w systemie wykrywania plagiatów, Oficyna Wydawnicza Politechniki Warszawskiej, ISBN 978-83-7814-189-1, 2014.
* [6] Marek Szczepański, Testy skuteczności algorytmu preselekcji Otwartego Systemu Antyplagiatowego, in Brunon Hołyst, Jacek Pomykała, Piotr Potejko (eds.) Nowe techniki badań kryminalistycznych a bezpieczeństwo informacji, pp. 248 – 256, PWN, ISBN/ISSN: 978-83-01-17890-1 , 2014
* [7] Marek Kowalski, Piotr Kruszyński, Ścibór Sobieski, Maciej Sysak, Geneza, architektura i testy otwartego systemu antyplagiatowego,w tomie pod redakcją Brunon Hołyst, Jacek Pomykała, Piotra Potejko (eds.) Nowe techniki badań kryminalistycznych a bezpieczeństwo informacji, pp. 257 – 273, PWN, ISBN/ISSN: 978-83-01-17890-1 , 2014
* [8] Marek Kowalski, Marek Szczepański, Identity of academic theses, in SimilarityResemblance and Difference. The Problem of Identity, IBLTeresa PANDobrzyńska & Raya Kuncheva eds., ILInstytut BANBadań Literackich Polskiej Akademii Nauk, wInstytut Literatury Bułgarskiej Akademii Nauk, pp. 259 – 278, ISBN 978-954-8712-97-2, druku2015.
 
{{przypisy}}
 
[[Kategoria:Prawo autorskie]]
[[Kategoria:Algorytmy tekstowe]]
/* {{Przypisy}} */