азербайджанец (sushilshik) wrote,
азербайджанец
sushilshik

Вебдванольный вопрос

Дано:
Имеем два набора облаков тегов (см. Web2.0). При этом у каждого тега есть еще и "сила" (частота встречаемости, релевантность) - видели, наверное, в модных вебдванольных сайтах в облаках тегов те ключевые слова, которые встречаются чаще, отображаются шрифтом большего размера.
Короче, у каждого ключевого слова в облаке тегов есть и частота встречаемости.

Вопрос: как наилучшим образом между двумя наборами облаков тегов найти те, чье сходство (близость) наибольшее, учитывая не только ассортимент ключевых слов (тегов) в облаке, но и их "силу" (встречаемость, релевантность)? Какие есть алгоритмы?

1) Специально пишу "наилучшим образом" ибо не хочу никак ограничивать вашу фантазию.
2) Верую в силу коллективного разума. Аминь.
Tags: ai, облака тегов
Subscribe
  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 16 comments