Polski słownik dla androida - lista najpopularniejszych słów języka polskiego

Jako, że nie każdy ma na swoim androidzie polski słownik, podaje przepis jak w prosty sposób go uzyskać.

Wymagania

Instrukcja

  1. Ściągamy i rozpakowujemy słownik.
  2. Zmieniamy mu nazwę na przyjemniejszą np. lista.txt
  3. Wywalamy z początku tekstu zbędne linie - opis i licencję.
  4. Sortujemy listę słów po częstotliwości występowania
1
2
sort -nr -k2 -t = lista.txt > lista2.txt

  1. Doprowadzamy listę do wymaganego przez UDM formatu - jedno słowo w linii
1
cat lista2.txt |cut -d = -f 1 > lista3.txt
  1. Wycinamy z pliku tyle linii ile chcemy, pamiętając, że zbyt duża liczba powoduje zawieszenie UDM. Dobrą liczbą na początek jest np. 3000 (Patrz pkt. 7.)
1
head -n 3000 lista3.txt > lista4.txt
  1. Zgrywamy na kartę i importujemy za pomocą UDM-a.Przy wspomnianych trzech tysiącach słów import trwał długo. Kilkakrotnie trzeba było klikać w czekaj. Lepiej też nie dopuszczać do przejścia telefonu w stan uśpienia.

Uwagi

Gdy chcemy mieć bogatszy słownik tworzymy po prostu kilka kolejnych plików zamiast jednego wielkiego. Czynimy to modyfikując punkt 7 następująco (dla plików po 1000 słów):

1
2
sed -n '1,1000 p' lista3.txt > lista4-1.txt
sed -n '1001,2000 p' lista3.txt > lista4-2.txt itd.

Wersja bez polskich znaków Dla uzyskania wersji smsowej (bez krzaczków) wykonujemy komendę na pliku końcowym:

1
iconv -f utf-8 -t ascii//translit -o lista4sms.txt lista4.txt

Możemy też wgrać obie listy i potem w UDM-ie użyć opcji „clear” dla usunięcia “duplikatów”.

Oczywiście analogicznie możemy zrobić sobie słowniki dla angielskiego, niemieckiego, francuskiego, quenya czy też klingońskiego.

Załadować komentarze?