Skocz do zawartości

SYNOGLOTA - zaawansowany synonimizator tekstu


dziki_rysio_997

Rekomendowane odpowiedzi

Tu masz zdecydowaną rację, stąd poprawka, którą możesz pobrać powyżej (nie wiem, czy przeoczyłeś tego posta, czy nie :) ).

Co do edytora tekstowego, bo jak zrozumiałem o nim rozmawiamy - taki jest komponent biblioteki graficznej, której użyłem. Proszę napisz jednak, co można by było zrobić, by był bardziej przyjazny, a ja pomyślę, na ile to jest wykonalne i jakim kosztem (bo być może nie chciałbym tego robić kosztem innych funkcjonalności). :)

Pozdrawiam

Odnośnik do komentarza
Udostępnij na innych stronach

  • Odpowiedzi 242
  • Dodano
  • Ostatniej odpowiedzi

Oderwałem się od kompa i nie odświeżyłem, tylko dlatego.

Jeśli chodzi o samą edycję, przede wszystkim "normalne" przenoszenie wyrazów.

Ja bym jednak nie zagłębiał się temat szlifowania edytora. Uważam, że szkoda na to energii. Lepiej przeznaczyć na rozwój właściwej części programu.

Jeszcze taki drobiazg - przy otwieraniu okienka "Popraw odmianę" mógłby tam się pokazywać tekst do poprawienia, nie trzeba by go całego przepisywać.

A poza tym - PROGRAM JEST BOSKI !

(No nie mogłem się już dłużej opierać ;) )

Odnośnik do komentarza
Udostępnij na innych stronach

Z lekkim poślizgiem przedstawiam:

SYNOGLOTA DLA JĘZYKA ANGIELSKIEGO!

Informacje dla niecierpliwych (a niżej będzie kilka słów ode mnie :) ):

Cena:
49zł
.

Promocyjna cena dla osób posiadających już Synoglotę dla języka polskiego:
39zł
.

Promocyjna cena zestawu Synoglota PL + ENG:
88zł

zamówienia, pytania, testy i inne - zapraszam na:
bok@nanomedia.pl
lub
PW

POBIERZ:
---

Program uruchomi się jako wersja demo, możliwy jest jednodniowy test pełnej wersji.

Kilka słów ode mnie:

Wersja angielska jest lżejsza od polskiej - zajmuje ok. 300MB miejsca na dysku, paczka też jest mniejsza - ok. 65MB.

Funkcjonalnie niemal całkowicie pokrywa się z aktualną wersją dla języka polskiego, starając się ujednolicić ich wersjonowanie, wersja angielska startuje od numeru 1.3.

Chciałbym, żeby oba "bliźniacze" programy były rozwijane równolegle jeśli chodzi o funkcjonalność.

Jestem przekonany, że wersja angielska przypadnie do gustu tym, którzy polubili półautomatyczne graficzne narzędzie tworzenia sensownych tekstów znane z wersji polskiej. :)

Ci, którym nie zależy na sensownych tekstach też znajdą coś dla siebie. :)

Organizacyjnie: nie chciałem tworzyć nowego wątku dla angielskiej wersji programu, żeby nie robić bałaganu na forum, jeśli jednak uważacie inaczej to może będzie trzeba pomyśleć o rozdzieleniu (oczywiście za zgodą Moderatora).

Życzę miłego korzystania z programu! :)

Odnośnik do komentarza
Udostępnij na innych stronach

Dzięki pomocy Moderatora (@początkujący, dziękuję jeszcze raz za pomoc), w pierwszym poście zostały przypięte linki do pobierania wersji programu dla języka angielskiego i wersji linux.

Jeszcze mała łatka - był bug w funkcjonalności poprawy formy słowa z poziomu narzędzia graficznego - chyba niewiele osób z tego korzysta, bo minęło trochę czasu zanim to zostało zgłoszone. :)

Tak czy inaczej, jeśli ktoś z tego korzysta, bardzo proszę o podmianę binarki programu na poprawioną:

łatka - funkcjonalność poprawy formy słowa z poziomu narzędzia graficznego

Odnośnik do komentarza
Udostępnij na innych stronach

Czy można by dodać do programu funkcjonalność spinowania z podanych wcześniej anchorów i linków - zestawów i wstawiania ich do tekstu? :)

Mam osobny spinner, ale w jednym programie było by to fajne :)

Odnośnik do komentarza
Udostępnij na innych stronach

@TheMatthew173:

Jest trochę propozycji dotyczących usprawnienia już istniejących funkcjonalności, ale o tym napiszę szczegółowo za jakiś czas.

Z ciekawszych tematów, robiłem pewne rozeznanie jeśli chodzi o implementację generatora tekstów. I muszę powiedzieć, że mam sporo wątpliwości przeróżnej natury.

Zachęcam zainteresowanych tematyką GENEROWANIA TEKSTÓW do przeczytania kilku poniższych zdań (przepraszam, że są długie ;) ), chętnie wysłucham Waszego zdania:

Wstępnie napisałem, że jest jakaś szansa na generator tekstów w wersji 1.4 programu. Ale gdy zabrałem się do pisania czegoś w rodzaju prototypu, wyszło na to, że aby zrobić to sensownie (mam na myśli model języka i potencjał do generowania dużej ilości tekstów) oraz wydajnie, konieczne jest dość znaczące rozbudowanie (i przebudowanie, zoptymalizowanie pod kątem szybkiej generacji tekstów) bazy danych programu. I tu jest podwójny zgrzyt: 90% Użytkowników Synogloty tego kompletnie nie potrzebuje, nie mówiąc już o tym, że jeśli chcemy to zrobić sensownie to tak naprawdę rośnie (co do ilości zagadnień, którymi można się w jego ramach zająć) drugi projekt, bez dużego związku z macierzystym.

Co umie "na dzisiaj" prototyp generatora:

- wykorzystuje szablony zdań występujących w języku polskim

- posiada model probabilitstyczny języka dla danych kategorii tematycznych (czyli jeśli chcemy mieć tekst o tematyce finansowej, to słowa i dwójki występujących po sobie wyrazów dobierane są według prawdopodobieństwa ich wystąpienia po sobie w rzeczywistych tekstach pochodzących z danej kategorii tematycznej

Przykład tekstu generowanego przez prototyp generatora po ustawieniu tematyki na "finanse":

Może on jest to drugie tyle co banki zostały już o takich postulatach. Przyjdą jeszcze stopy referencyjnej na kredyt. Spółka ma też zastaw złoto to jak warunki umowy, naliczane i po miesięczne. To więcej do 30% wszystkich części pojazdu i PZU tak to bez na życie. Robią tak to są tak naprawde to też pożyczki gdy chcą zaciągnąć taki o podatku cena wina kupuje się. W internecie to do BIK a co nie - w przypadku o odsetki. Dlatego tak jak widzimy, mają swoje kłopoty. Co tak tanie polisy i to długi z ważną polisę z nich, a i działa.

Co jest charakterystyczne dla takiego tekstu:

- jest zgodny z modelem języka

- ma takie nasycenie słowami charakterystycznymi dla danej tematyki jak jakościowe artykuły

- nie ma sensu (generator nie analizuje sensu zdania, dba tylko o model języka bez znaczeń; w jakimś stopniu zamierzam to poprawić)

- cechuje się dużym "bezpieczeństwem" jeśli chodzi o unikalność/podobieństwo do innych tekstów - nie jest synonimizowany, tylko tworzony od zera

Teraz proszę o radę tych, którzy wykorzystują tego rodzaju teksty.

Czy tego rodzaju projekt przedstawia dla Was jakąś wartość (to, co powyżej to output z prototypu, ale powinien dawać pewne wyobrażenie) i chcielibyście, żeby był dalej realizowany?

Ciekaw też jestem, ile jest takich osób?

@san:

Proszę rozwiń, bo nie wiem, czy dobrze zrozumiałem.

Masz na myśli:

1. Podanie listy link - anchor czy dwóch niezależnych do losowego doboru par link-anchor.

2. Program miałby odszukiwać wystąpienia anchorów w tekście i tam wstawiać linka czy umieszczać je w inny sposób?

Odnośnik do komentarza
Udostępnij na innych stronach

@rysio - dokładnie tak jak napisałeś - w dwóch osobnych oknach wpisujesz anchory i linki, potem z tego generujesz wymieszane linki z anchorami i wstawiasz do tekstu:

Linki:
https://site1.com
https://site2.com
https://site3.com

Anchory:
key1
key2
key3

Zespinowane:
<a href="{https://site1.com|https://site2.com|https://site3.com}">{key1|key2|key3}</a>

Druga opisana przez Ciebie funkcjonalność też byłaby bardzo pomocna - wyszukiwanie anchoru w tekście i wstawianie tam linka, albo wygenerowanego wcześniej zestawu linków i anchorów :)

Brakuje mi takich funkcjonalności w kilku programach, tam gdzie nie ma automatycznego wstawiania linków i anchorów do tekstów.

Myślę, że taka funkcjonalność zwiększy atrakcyjność i tak już bardzo dobrego programu, jaki oferujesz :)

Odnośnik do komentarza
Udostępnij na innych stronach

Co do generatora, bo między innymi ja równiez postulowałem jego wprowadzenie, to tylko kwestią jest dodanie testowania unikalności takiego tekstu w google - bo mogą się pojawić jakieś powtórzenia gdy wszyscy userzy zaczną generować teksty z jakiejś tematyki. Chyba, że definiujemy samemu żródła z jakiegoś skryptu/rss to wtedy problem odpada.

Co do jakości tekstów - to umówmy się - moze ona się poprawiać z kolejnymi wersjami, ale nigdy z żadnego synonimizatora nie wyjdzie jak pisana z ręki. Więc raczej chodzi tu o szybkie wykorzystanie dużej bazy synonimów programu do generowania średnio/niskiej jakości tekstów unikatowych. Tak jak ktoś pisał wczesniej - żeby nie trzeba było za każym razem otwierać artelisa :) Takze ja jestem jak najbardziej za wprowadzeniem tej funkcjonalności.

Odnośnik do komentarza
Udostępnij na innych stronach

Mocno zastanawiam się przejść z seo leniwca na synoglotę, ale nie wiem czy jest sens.

W czym jest lepszy ten soft od seoleniwca?

Czy dobrze zrozumiem, że tutaj muszę przeklinać każdy artykuł, aby był dobrze zrozumiały po generowaniu z synonimów?

A może on zapamiętuje synonimy do słowa i z czasem wstawia je automatycznie?

Odnośnik do komentarza
Udostępnij na innych stronach

@ar4:

Jeśli chcesz, możesz przetestować program w pełnej wersji przez 1 dzień bez zobowiązań (proszę o takie info np. na PW). W ten sposób najławiej przekonasz się, czy to program pod Twoje potrzeby.

Co do programu:

Atutem jest bardzo duża baza synonimów (to z dwóch względów - osoby piszące teksty "dla ludzi" mają z czego wybierać, a Ci, którzy chcą mieć sieczkę dostają po prostu sieczkę klasy (mniej więcej) 13 słów/słowo wejściowe (co pozwala się dobrze bronić przed desynonimizacją).

Są dostępne różne tryby synonimizacji:

- automatyczna (z pewnością nie jest to tryb dla tych, którzy chcą mieć teksty "dla ludzi")

- półautomatyczna (możliwość wyboru słów za pomocą trybu graficznego

- synonimizacja "frazami" - np. piszesz teksty do katalogów w stylu:

Zapraszam {na moją stronę|do mojego serwisu}.

Potem klikasz na zapamiętanie fraz (program wyszukuje je w tekście). Po napisaniu kolejnego tekstu bez synonimów, możesz jednym kliknięciem wstawić zapamiętane synonimy (frazy).

Taki tekst z synonimami w postaci fraz można dalej synonimizować na poziomie pojedynczych słów, co daje dwa poziomy zagnieżdżenia.

- Jest możliwość zapamiętywania synonimów (pojedynczych) dodanych przez Użytkownika w trybie półautomatycznym (można ustalić wagę, czyli poziom "zaufania" programu do tych synonimów).

- Przy synonimizacji w trybie półautomatycznym program zapamiętuje kliknięcia w słowa, dzięki czemu "lubiane" przez Użytkownika synonimy stawia coraz wyżej.

- Program uwzględnia m.in. statystyki częstości występowania dwójek i trójek wyrazów do ustalania kolejności synonimów w danym miejscu (od najlepszego do najgorszego), uwzględnia tu również "wagę" synonimu i "zaufanie" wynikające z ilości sytuacji, w których Użytkownik ten synonim wybrał i tych, w których tego nie zrobił

- niektórzy cenią sobie również masową synonimizację tekstów (wszystkie pliki z katalogu) + automatyczną synonimizację DUŻYCH plików (nawet do kilku MB tekstu, z czym większość spinnerów sobie nie radzi)

Trochę się rozpisałem, w każdym razie zmierzam do tego, że program nie zagwarantuje wysokiej jakości tekstów "sam z siebie", natomiast im dłużej Użytkownik z nim pracuje, tym praca ta jest łatwiejsza, bo:

- rośnie baza fraz zapamiętanych przez program

- rośnie baza synonimów Użytkownika

- program gromadzi coraz większą "wiedzę" ucząc się ulubionych wyborów Użytkownika, co przekłada się na coraz łatwiejsze półautomatyczne synonimizacje i coraz lepsze jakościowo automatyczne (oczywiście przy ustawieniu suwakiem progu jakościowego - wtedy program odrzuca te, które jego zdaniem są gorzej dopasowane)

Myślę, że na dziś żadnej program w trybie automatycznym nie daje "ludzkich" tekstów dla języka polskiego (chyba, że z bardzo wąską, "bezpieczną" bazą synonimów - ale to ma z kolei inne minusy).

Odnośnik do komentarza
Udostępnij na innych stronach

Zarchiwizowany

Ten temat przebywa obecnie w archiwum. Dodawanie nowych odpowiedzi zostało zablokowane.


×
×
  • Dodaj nową pozycję...

Powiadomienie o plikach cookie

Umieściliśmy na Twoim urządzeniu pliki cookie, aby pomóc Ci usprawnić przeglądanie strony. Możesz dostosować ustawienia plików cookie, w przeciwnym wypadku zakładamy, że wyrażasz na to zgodę. Warunki użytkowania Polityka prywatności