Quantcast
Channel: Ru.Board
Viewing all articles
Browse latest Browse all 1276082

Электронные словари - технологии, техники, обмен (1916) / Практика создания и использования электронных словарей

$
0
0
andreyefgs:
Как вариант можно вытащить морфологию из Викисловаря

Демонстрационный код на Python-е:

Код:
import requests
import urllib.parse
from bs4 import BeautifulSoup

word = 'kutya' #собака по венгерски

#полнотекстовой поиск в hu.wiktionary.org
#https://hu.wiktionary.org/wiki/?fulltext=Search&search=kutya&limit=500
URL = f"https://hu.wiktionary.org/wiki/?fulltext=Search&search={urllib.parse.quote(word)}&limit=500"
page = requests.get(URL)


#В этом блоке вытаскиваем из полученной html-страницы все выделенные слова, т.е. <span class="searchmatch">слово</span>
soup = BeautifulSoup(page.content, "html.parser")
search_matches = soup.find_all("span", class_="searchmatch")
res = []
for span in search_matches:
res.append(span.text) #И добавляем всё найденное в массив



unique = list(set(res)) #Удаляем дубликаты
unique.remove(word) #Удаляем 'kutya' (начальную форму)


#Выводим
print(f'{word}={", ".join(unique)}')


Результат:



Viewing all articles
Browse latest Browse all 1276082

Trending Articles



<script src="https://jsc.adskeeper.com/r/s/rssing.com.1596347.js" async> </script>