一道算法的考博试题,望高手解答,该如何解决

一道算法的考博试题,望高手解答
一个来自于接口的连续数据流约有100G,全部由字符串构成。在停顿   时间后又开始新的如此规模的数据流。需要对这100G的数据排序并且重新通过接口发送出去。排序的时间大约是   的10倍。可以利用的其他资源只有PC机和以太网。请设计一个方案完成这项工作。需回答一下问题:
1.设计方案的简图
2.处理流程
3.数据处理算法的描述
4.基于O(   )的复杂性分析
5.评价

谢谢啊!


------解决方案--------------------
这个问题有几个地方比较复杂:
(1)对字符串排序(如果是字符排序就简单了)
(2)借助外存保存中间结果
(3)采用多路归并的方式,然后输出
(4)排序的时间大约是t的10倍--这个是困难的地方
------解决方案--------------------
只能靠外排 也就是楼上说的多路归并的方法.如果能依靠多台PC的话可以考虑并行的处理.
------解决方案--------------------
安装1T的内存呀。
如果有可能装10E的内存吧,这么小的数据量不成问题。
全部放入内存去处理。中间变量,存硬盘时间太慢了。
估计以后CPU的一级缓存都能有0.1 T
------解决方案--------------------
这道题的考察要点在于如何利用以太网和PC机在时间复杂度为O(n)级别内完成排序。优先的时间是10t,通过以太网传输给其他PC机和接收需要2t,排序的事由其他PC机在8t的时间限制内完成。这台机子负责发送和接收数据就可以了