Skocz do zawartości

SYNOGLOTA - zaawansowany synonimizator tekstu


dziki_rysio_997

Rekomendowane odpowiedzi

Jeśli chodzi o naukę - rozważam również opcję "kolaboracji", tj. każdy użytkownik tworzyłby własną "bazę wiedzy" z możliwością przesłania jej do centralnej (i otrzymania w zamian scalonej bazy z "wiedzą" zdobytą przez innych użytkowników w ramach korzystania programu).

to byłoby idealne :)

Najlepiej jakby system umiał synonimizowac/dobierać wyrazy mając na uwadze wyraz przed i wyraz po synonimizowanym wyrazie.

Odnośnik do komentarza
Udostępnij na innych stronach

  • Odpowiedzi 242
  • Dodano
  • Ostatniej odpowiedzi

On już to robi. :)

Zapytasz, dlaczego tak rzadko robi z tego użytek (patrząc po nie zawsze dobrych wynikach)?

- trzeba sobie odpowiedzieć na pytanie, ile w języku polskim par i trójek słów (występujących po sobie) wystarcza, by pokryć np. 90% tekstu? Odpowiedź na to pytanie jest mniej więcej taka, że baza programu byłaby nieznośnie duża (już teraz ma ok 1GB!) i to nawet jeśli rozpatrywać słowa w kategorii form podstawowych, z odmianami będzie jeszcze gorzej. Obecna baza dwójek i trójek słów dla języka polskiego została przeze mnie stworzona na bazie ponad 100 000 artykułów (i wcale nie po 1000 zzs ;)). Nie mówię już nawet o tym, jak długo trwałoby generowanie tekstu przy tak dużej bazie do przeszukiwania.

- rozważałem użycie jako zewnętrznej bazy danych takich "trójek" czy nawet "czwórek" słów... wyszukiwarki (i nawet ostatnio ktoś w mailu wspominał o tym :) ). Niestety, aby zsynonimizować 1000 znaków tekstu potrzeba czasem nawet kilka-kilkanaście tysięcy zapytań do wyszukiwarki. Nawet przy 100 prosiakach program by długo tak nie pociągnął. ;)

Być może kiedyś rozważę projekt "premium" - serwer dedykowany z ogromną bazą danych i dużą ilością pamięci (dla szybkiego działania), który pozwala na naprawdę dobrą synonimizację automatyczną. Pytanie tylko, ile osób byłoby skłonnych za to płacić (i jaką to reprezentuje dla nich wartość?) - w szczególności biorąc pod uwagę, że to może być i tak niewystarczające dla pełnowartościowej synonimizacji ze względu na kwestię podobieństwa znaczeniowego słów (mało jest synonimów "1:1" odpowiadających sobie znaczeniowo, raczej znaczenia mniej lub bardziej się zazębiają, ew. jedno zawiera się w drugim. Takie teksty może nie zawierałyby bardzo wielu błędów, ale i tak trzebaby je przeglądać.

Odnośnik do komentarza
Udostępnij na innych stronach

Jak to by miało wyglądać? Baza pełnych zdań będących synonimami innych zdań czy jak? :)

Taka funkcje z tego co pamiętam widziałem w tym sofcie https://thebestspinner.com/

Proszę się przyglądnąć jego funkcjonalności.

Potrzebujesz domeny? Dobrego, taniego i niezawodnego hostingu WWW? Darmowego certyfikatu SSL?

 -> Aktualna oferta, sprawdź teraz ! <-

Odnośnik do komentarza
Udostępnij na innych stronach

Przydałaby się opcja sprawdzania poprawności klamer. Obecnie jak coś jest niedomknięte to po prostu nie wygeneruje tekstu. Przydatne przy ręcznym pisaniu tekstów.

Poza tym brakuje opcji kopiuj-wklej przy pomocy prawego przyciska myszy (chyba że to tylko u mnie nie działa) i otwierania tekstu z pliku.

Odnośnik do komentarza
Udostępnij na innych stronach

Nowa promocja na długi weekend:

"Zamiast grillować, lepiej synonimizować!" - koszt zakupu programu w promocji to jedyne 39zł.

Zebrałem dotychczasowe pomysły na rozwój (za co bardzo Użytkownikom dziękuję!). Zapraszam do zgłaszania kolejnych i wypowiadania się na temat kolejności, w jakiej chcielibyście, by były realizowane pomysły nie przydzielone jeszcze do żadnej z planowanych w najbliższym czasie aktualizacji.

Wersja 1.1 programu (ok. 10.05.2013.):

  • dodawanie własnych synonimów
  • tworzenie czarnej listy synonimów
  • drugi algorytm sprawdzania unikalności (bardzo dokładny, ale bardziej zasobożerny)
  • optymalizacja szybkości działania - ustalenie poziomu wykorzystywanej pamięci (większa część bazy w pamięci to szybsza synonimizacja - wąskim gardłem jest odczyt z dysku)
  • generowanie większej ilości tekstów do podglądu (do tej pory był 1)

Wersja 1.2 programu (ok. 10.06.2013.):

  • obsługa tekstów z linkami w treści
  • kopiuj - wklej pod prawym przyciskiem myszy
  • możliwość powiększenia okna programu/lepsze wykorzystanie wyższej rozdzielczości ekranu
  • przyjazne dla użytkownika sprawdzanie poprawności struktury klamer
  • otwieranie tekstu z pliku

Następne aktualizacje:

  • wersja na maka
  • wersja na linuksa
  • automatyczne pobieranie tekstów do synonimizacji ze zdefiniowanych źródeł
  • synonimizacja tekstów w językach innych niż polski
  • wybór synonimów w edytorze tekstowym (pod prawym klawiszem myszki)
  • "umiejętność nauki" - zapamiętywanie dokonywanych przez użytkownika wyborów
  • synonimizacja pełnymi zdaniami
  • integracja z innymi narzędziami SEO

Odnośnik do komentarza
Udostępnij na innych stronach

a ja chcę tak zebym podał URL i anchora do niego i żeby mi sam znalazł tekst, sam go zsynomizował, podmienił frazę będącą podanym anchorem na linka i wygenerował takiego gotowca do wklejania w dodawarkach. No i żeby całość nieźle się czytała. Da radę? :)

Odnośnik do komentarza
Udostępnij na innych stronach

@qazy:

Mniej więcej coś takiego zostało ujęte w: "automatyczne pobieranie tekstów do synonimizacji ze zdefiniowanych źródeł".

Myślę, że jest do zrobienia z dokładnością do tego, że jeśli chcesz mieć naprawdę dobry tekst to będziesz musiał wybrać najlepsze synonimy w trybie półautomatycznej synonimizacji. :)

Wstępnie myślę, że funkcjonalność może się znaleźć w wersji 1.3 lub 1.4.

Odnośnik do komentarza
Udostępnij na innych stronach

Mogą byc 2 opcje - lepsza synonimizacja - tryb półautomatu graficzny - i na precle czy podlinkowanie jak pisze kolega wyżej ze zdefiniowanych żródeł- fajnie jak by to było w 2 aktualizacji - czerwcowej.

Natomiast widzę duży błąd - nie wiem czy został już zgłoszony przez innych - przy podaniu tekstu do automatycznej syninimizacji powyżej ok. 2000 znaków jako wynik synonimizacji są niedomknięte klamry - zgłasza mi to np seocat i donlinkage. Ten sam tekst gdy skrócę przed synonimizacją do np 1500-1800 znaków po synonimizacji nie ma juz niedomkniętych klamr - nie wiem czy to coś z wydajnościa jest przy większym objętościowo tekscie - ale trzeba by to wybadać.

Odnośnik do komentarza
Udostępnij na innych stronach

@mindryl:

Z pewnością sprawdzę to przy najbliższych pracach nad programem. Gdybym miał problem z wygenerowaniem tego problemu u siebie - poproszę Cię o przykład takiego tekstu.

@avavsky:

Przytoczę to, co pisałem wyżej:

Co do aktualizacji (zaraz przypnę to gdzieś wysoko, żeby można było łatwo znaleźć):

Wszystkie poprawki będą bezpłatne. Małe aktualizacje (taka, jak najbliższa czy następna w kolejności) będą bezpłatne. Płatne mogą być aktualizacje będące ZNACZNYM rozszerzeniem funkcjonalności czy wiążące się ze ZNACZNĄ poprawą jakości działania programu. Takie będą ujmowane w dużych numerach wersji, będą rzadkie, a przewidywany koszt aktualizacji dla osób posiadających licencję będzie w okolicach 20-25% ceny wersji podstawowej (Chyba 10zł za znaczącą aktualizację to nie jest za dużo? ). :)

Swoją drogą, szkoda, że nie mogę edytować pierwszego postu - chętnie przykleiłbym jeszcze kilka informacji, np. takich, jak powyższa.

Odnośnik do komentarza
Udostępnij na innych stronach

Zarchiwizowany

Ten temat przebywa obecnie w archiwum. Dodawanie nowych odpowiedzi zostało zablokowane.


×
×
  • Dodaj nową pozycję...

Powiadomienie o plikach cookie

Umieściliśmy na Twoim urządzeniu pliki cookie, aby pomóc Ci usprawnić przeglądanie strony. Możesz dostosować ustawienia plików cookie, w przeciwnym wypadku zakładamy, że wyrażasz na to zgodę. Warunki użytkowania Polityka prywatności