RAG Text Scraper - Efektywne wydobywanie treści
RAG Text Scraper to rozbudowana wtyczka do przeglądarki Chrome, która automatyzuje proces wydobywania czystych treści z artykułów internetowych. Narzędzie jest przeznaczone dla programistów, badaczy oraz entuzjastów AI, umożliwiając im łatwe tworzenie wysokiej jakości zestawów danych tekstowych do systemów RAG. Dzięki możliwości przetwarzania wielu adresów URL jednocześnie oraz inteligentnemu usuwaniu zbędnych elementów strony, użytkownicy mogą szybko uzyskać gotowe pliki .txt.
Wtyczka korzysta z biblioteki Readability.js, aby wydobyć główną treść artykułu, eliminując reklamy i inne zakłócenia. Dodatkowo, opcjonalna funkcja opartej na AI poprawy jakości tekstu pozwala na dalsze oczyszczanie danych. Użytkownicy mogą łatwo pobierać artykuły w formacie .txt, zawierające metadane, takie jak adres URL źródła oraz datę wydobycia.





