AI Semantic Scholar va scurta un articol științific lung la o singură frază

Institutul Allen pentru Inteligență Artificială din Seattle a dezvăluit săptămâna trecută sistemul Semantic Scholar, care oferă o compresie extremă de articole științifice și tehnice îndelungate pentru a reduce timpul petrecut în studierea lor.

Este un instrument de cercetare bazat pe AI care poate fi util într-un mediu științific. Datorită funcției de abstractizare, el poate vizualiza o cantitate imensă de literatură științifică, reducând materialul procesat la literalmente o frază.

Serviciile Semantic Scholar au fost utilizate de 7 milioane de utilizatori într-o lună, baza de date conținând 10 milioane de articole despre informatică. Potrivit unuia dintre dezvoltatorii sistemului, Dan Weld, baza de date existentă va fi actualizată în mod regulat - inclusiv articole despre alte discipline.

Acest lucru este departe de primul program de procesare a limbajului natural pentru generalizarea documentelor. De obicei, una dintre cele două abordări este utilizată pentru a rezolva această problemă - fie extractivă, făcând o alegere în favoarea unui text reprezentativ și utilizarea textuală a acestuia într-un CV, fie abstractă, când algoritmii de generare a limbajului natural sunt folosiți pentru a crea un CV cu un original cuvântare.

În schimb, Semantic Scholar are un raport de compresie extrem de ridicat. De exemplu, un rezumat al articolului de 5.000 de cuvinte va fi doar 21 de cuvinte, adică 1: 238. Cel mai apropiat competitor, Semantic Scholar, are această cifră de 1:36.

Institutul Allen oferă codul său absolut gratuit tuturor și vă invită, de asemenea, să vizitați site-ul său demo scitldr.apps.allenai.org. Până în prezent, depozitul Semantic Scholar este umplut exclusiv cu materiale în limba engleză, dar în timp va fi completat cu documente în alte limbi.