C# 求教 提取快讯中地点方法

C# 求教 提取新闻中地点方法
我现在有几个文件夹的数据,一个文件夹大概100篇从纽约时报爬的新闻。

我现在的问题是怎么从这新闻里面提取它的发生地点?

我已经做的工作是提取新闻关键字、题目以及作者等信息。

难点是新闻里有的地点写在开头,但是有的在新闻中间不好判断。

求大神帮忙!
------解决方案--------------------
这个难度略大,什么都不知道,就是文字 怎么去知道哪几个字是地点呢? 除非地点的前面和后面有特殊标识,然后去匹配。
------解决方案--------------------
关键你对准确率有没有要求。没有要求的话,你可以将句子开头,但是首字母大写的单词提取出来,这些单词就是专有名词。

而如果它前面带着at in之类的介词,那么是地点的可能性就很大了。
------解决方案--------------------
C# 求教 提取快讯中地点方法
做个地点字典,为防止一个文章同时出现这个字典两个以下为这个字典做个 优先级关建字,然后把抓下来的新闻与这个字典做比较 这样更精确一些。地点可能会很多,但不可能无限的增加。毕竟一下地方名称是固定的。
------解决方案--------------------
除非文章地点有特殊格式表示,否则只能用地点库来匹配