支持“普通”web应用程序的合理设置可能会发展如下:
- Single combined application/database server
- Separate database on a different machine
- Second application server with DNS round-robin (poor man s load balancing) or, e.g. Perlbal
- Second, replicated database server (for read loads, requires some application logic changes so eligible database reads go to a slave)
在这一点上,评估当前的事态将有助于确定更好的扩展路径。例如,如果读取负载很高,并且内容不会经常更改,那么最好强调缓存并引入专用的前端缓存,例如Squid以避免不需要的数据库读取,尽管您需要考虑如何维护缓存一致性,通常在应用程序中。
另一方面,如果内容经常发生变化,那么您可能更喜欢更分散的解决方案;引入更多的应用程序服务器和数据库从属服务器来帮助减轻影响,并使用对象缓存,如memcached以避免因不太稳定的内容而影响数据库。
对于大多数网站来说,这可能已经足够了,尽管如果你真的成为了一种全球现象,那么你可能会开始考虑在区域数据中心安装硬件,并使用地理负载平衡等技巧将访问者引导到最近的“集群”。到那时,你可能会雇佣到能够对事情进行微调的工程师。
我能想到的最有价值的扩展建议可能是避免过早地担心这一切;专注于开发人们想要使用的服务,并使应用程序合理地健壮。一些简单的早期优化是为了确保你的数据库设计相当可靠,并设置索引,这样你就不会做任何令人痛苦的疯狂事情;此外,请确保应用程序发出缓存控制头,指导浏览器如何缓存数据。在设计的早期做这类工作可以在以后产生好处,尤其是当您不必为了处理缓存一致性问题而返工时。
我想传达的第二条最有价值的建议是,你不应该认为对其他网站有效的东西会对你有效;检查日志,对流量进行一些分析,并对应用程序进行配置——查看瓶颈所在并解决它们。