Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Начинающим";
Текущий архив: 2013.03.22;
Скачать: [xml.tar.bz2];

Вниз

Парсинг текста и использование рег.выражений?   Найти похожие ветки 

 
Pcrepair ©   (2012-03-25 15:35) [0]

Добрый день
Есть необходимость определить сколько раз в тексте встречается заданное слово
=====================================================
Например, слово = "электроника"
Текст = "Консалтинговая компания Accenture опросила 10 000 человек в 10 странах, в том числе в России, и выяснила, как отличаются предпочтения в области Интернета и электроники людей разного возраста."
где встречается похожее слово "электроники" один раз
Программа должна сообщить об одном совпадении
======================================================

Вопрос: какой способ лучше (стабильная работа, скорость обработки, менее сложный код) применить для разработки кода программы:
- код на основе POS или POSex
- сторонний для ДЕЛФИ TRegExpr
- Microsoft VBScript Regular Expressions или TRegExp
- может что то еще появилось?
РАД2010


 
Ega23 ©   (2012-03-25 15:37) [1]

http://delphimaster.net/view/2-1332577830/

А где магическое слово "ПЕРЕМ"?


 
Sha ©   (2012-03-25 15:48) [2]

Для поиска в тексте слов, похожих на ПЕРЕМ,
сначала имеет смысл подвергнуть эту ПЕРЕМ стеммингу,
а затем в цикле воспользоваться функцией PosEx(ПЕРЕМ, Text, Start).


 
Pcrepair ©   (2012-03-25 18:32) [3]

а если сравнивать в отдельном цикле слово "образец" и слово, к примеру "электрон" и "электронный" и при совпадении слов более заданого процента
(к примеру 50%) считать совпадение валидным, можно наверно обойтись без стемминга и прочих усложнений?


 
Sha ©   (2012-03-25 18:37) [4]

автор взял автомат и сел в автобус


 
Pcrepair ©   (2012-03-25 18:44) [5]

ну не будем все усложнять. это ведь не ИИ чтобы различать разницу между автоматами
речь идет о простой программе, способной по простому рассортировать на нужное и не нужное


 
Ega23 ©   (2012-03-26 00:09) [6]


> а если сравнивать в отдельном цикле слово "образец" и слово,
>  к примеру "электрон" и "электронный" и при совпадении слов
> более заданого процента
> (к примеру 50%) считать совпадение валидным, можно наверно
> обойтись без стемминга и прочих усложнений?

http://ru.wikipedia.org/wiki/%D0%A0%D0%B0%D1%81%D1%81%D1%82%D0%BE%D1%8F%D0%BD%D0%B8%D0%B5_%D0%9B%D0%B5%D0%B2%D0%B5%D0%BD%D1%88%D1%82%D0%B5%D0%B9%D0%BD%D0%B0


 
Dimka Maslov ©   (2012-03-27 10:28) [7]

Не, гугл зря беспокоится о появлении нового конкурента. Не тот случай


 
Anatoly Podgoretsky ©   (2012-03-27 10:56) [8]

Никакой опасности у Гугла нет.



Страницы: 1 вся ветка

Форум: "Начинающим";
Текущий архив: 2013.03.22;
Скачать: [xml.tar.bz2];

Наверх





Память: 0.46 MB
Время: 0.078 c
15-1334142183
Сергей М.
2012-04-11 15:03
2013.03.22
Занимательная криптография


15-1339590107
Хригорий
2012-06-13 16:21
2013.03.22
Что такое нативный язык программирования?


15-1343319699
alexdn
2012-07-26 20:21
2013.03.22
php, цвет ссылки


2-1336062569
pr20122012
2012-05-03 20:29
2013.03.22
ACCESS SQL UPDATE в зависимости от даты


2-1342770409
Andvitar
2012-07-20 11:46
2013.03.22
Програмное нажатие на Button 1 при изменении буфера обмена





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский