熟悉全文检索的来探讨一下
我现在需要做一个系统,数据库存储海量数据(假设是1亿条大小为1k的文本数据,实际可能没这么多),我需要响应用户的搜索。比如用户输入“中国”,那么可能在这1亿条文本数据里面查找。请问如何设计数据库,都需要什么技术?
本来我的设想是利用mySQL的自带的全文检索功能,我需要做的仅仅就是分词,但是听说性能不太好,数据超过1百万条的很容易使数据库挂掉,而且这个查询功能相当频繁。目前我的系统是php+mysql实现。百度应该也是mysql做的数据,他是怎么实现的呢?分布式数据库?还是其他?