维基百科上有关一些Google物理构造的资料,转载过来:
Google于全球数个地方,雇用服务器中心来存放较低成本的普通电脑,运行Red Hat Linux操作系统来回应搜索要求和索引网页。这个于服务器中心建立的“服务器园地”以Shared nothing architecture (分布式数据库结构) 建造。索引是由程序Googlebot执行,它会定期地请求访问已知的索引建立新页面。页面更新愈快,Googlebot访问亦会愈多。再通过在这些已索引网页上的连结来发现新页面,并加入到数据库。索引数据库和网页缓存大小是以兆兆字节(terabyte)来衡量的。Google发展了一套档案系统名为Google 档案系统 ,储存这些资料。
Google使用的这些机器的精确大小和位于何处至今未知;Google官方刻意含糊其词。在John Hennessy和David A. Patterson所著的《计算机建筑:走进大数》中,推测Google的服务器场中群集计算机群形成的“搜寻场”在2000年大约应该有6000个处理器,12000个普通IDE硬盘(即每个机器2个硬盘1个处理器),他们位于四个地方:二个在 硅谷和二个在 维吉尼亚。每个都以OC 48的线路(2488 Mbit/s,参见带宽)连接着因特网并且有一个OC 12(622 Mbit/s)线路连接着其他3个Google分站点。这些连接使用思科12000网关,用二个Foundry Networks BigIron 8000的以太网交换器分流成4 x 1 Gbit/s的线路连接到64个服务器夹,里面前后各是40台电脑和1台惠普以太网交换机,所以一个架子共有80个机器和2个惠普交换机。
Google在2004年4月发布的IPO S-1表单后,大财政公司的英特网开发单位副总裁Tristan Louis估计了现在的服务器场包含下列各项[1]:
- 719个服务器架
- 63,272台机器
- 126,544个处理器
- 253,088 GHz的处理能力
- 126,544 GB内存
- 5,062 TB的硬盘空间
延伸阅读:
1、How many Google machines
2、[pdf] Google Linux Cluster的系统结构分析






















