设计Web应用程序时要注意可伸缩性

原创

justjavac

web

2012/08/22 09:44

阅读数 366

Max Indelicato是一位软件开发主管和前首席软件架构师，他最近发表了一篇关于如何设计具备可伸缩性的web应用程序的文章。他提出要选择正确的部署和存储解决方案，选择可伸缩的数据存储和模式，并且使用抽象层。

适合工作的工具

Indelicato的第一个建议是“为工作选择正确的工具”，想要达到这个目的，就要选择下列架构解决方案中的一种：

使用云部署解决方案
使用可伸缩的数据存储解决方案，像MongoDB、CouchDB、Cassandra或者Redis。
添加高速缓存层，像Memcached。

他认为在开始开发应用程序的时候，这些解决方案并不是必须的，但是在开始时就选择可伸缩的数据存储解决方案是很明智的，因为那会避免之后再进行切换。将应用程序部署到云中会为我们带来一些好处，特别是对于创业公司来说，因为他们无法准确地确定他们的应用程序在启用之后会有多少人使用。将应用程序部署到云中之后，当需求增加时，就可以让应用程序以优雅的方式进行伸缩。很多软件架构师都讲述了他们不得不对应用程序进行扩展的事件，其中他们会引入高速缓存层，那会解决大部分问题。但是我们应该在设计阶段就考虑相应的解决方案。这样在之后就很容易实现了。

可伸缩的数据存储

接下来，Indelicato建议选择支持分区、复制并且有弹性的数据存储，包括以下几种： MongoDB、Cassandra、Redis、Tokyo Cabinet、Project Voldemort，或者选择MySQL作为关系型数据库。这是很必要的，因为不管怎样，在应用程序的生命周期中，分区都是必要的。对于可伸缩性来说，分区并不是必需的，但是对于“确保高可用性”就是必需的。灵活性可以让我们快速地增加更多的节点，这可能是出现流量峰值的时候，也可能是“由于硬件故障或升级、大型的伸缩模式的变更或者任何需要让节点下线的情况下，需要对节点进行维护的时候。”

可伸缩的数据模式

Indelicato建议创建一种模式，从而让我们可以很容易地进行数据sharding，他还给出了下面的临时组件的例子，User和UserFeedEntry：

Collection (or Table, or Entries, etc) User

{

UserId : guid, unique, key

Username : string

PasswordHash : string

LastModified : timestamp

Created : timestamp

}

Collection (or Table, or Entries, etc) UserFeedEntry

{

UserFeedEntryId : guid, unique, key

UserId : guid, unique, foreign key

Body : string

LastModified : timestamp

Created : timestamp

}

然后他建议根据UserId进行分区：

通过根据UserId字段对User集合和UserFeedEntry集合分区，我们会将两种相关的数据块放在同一个节点上。所有UserId为 xxx-xxx-xxx-xxx的UserFeedEntry数据和UserId为xxx-xxx-xxx-xxx的User数据会被包含在同一数据片段中。

为什么这是可伸缩的呢？因为我们对于这个应用程序的需求完全是针对数据的分发的。当每个访问者访问User的信息页面时，系统会向数据片段发出请求以获取User栏显示用户的详细信息，然后再向同一个数据片段发出请求以获得用户的UserFeedEntries。这两个请求中，一个会获得一条数据，而另一个会获得多条数据，而这些数据都包含在同一数据片段中。假设在一天之中对大多数用户的信息都有相同次数的访问，那么我们已经设计了可伸缩的模式，它会支持我们的web应用程序的需求。

使用抽象层

Indelicato的最后一条建议是使用下述抽象层中的一种，但不仅限于这些：元数据库（Repository）、缓存和服务。当创建元数据库层的时候，他建议：

不要以针对你所抽象的数据存储特有的方式来为方法命名。例如，如果你抽象的是关系型的数据库，一般我们会为了执行SQL查询和命令而定义Select()、Insert()、Delete()、 Update()函数。不要这么做。相反，应该让你的函数名不那么专门化，可以使用Fetch()、Put()、Delete()和Replace()。这会确保你更好地遵循元数据库模式，并且当你需要切换底层数据库的时候，工作会更简单。

如果可能的话使用接口（或者抽象类等等）将这些接口传递给应用程序中更高的层，这样你永远不会直接引用元数据库的特定的固有实现。这对于构建和单元测试也是非常棒的，因为你可以编写其他固有实现，它们会预先带有与测试案例相关的数据。

将所有针对存储的特殊代码封装到一个类（或者模块等等）中，真正的元数据库会引用或者继承它。只在每个函数中放置针对存取函数所必需的细节（查询语句等等）。

时刻要牢记，并非所有元数据库都需要抽象相同的数据存储解决方案。只要你愿意，你可以将User存储在MySQL中，而将 UserFeedEntries存储在MongoDB中，元数据库要以这样的方式实现，它们支持这么做而不需要付出太多代价。之前的三点建议也间接地有助于我们做到这一点。

Indelicato说，对于高速缓存层，在开始时他经常会使用“简单的页面（或者视图等等）级别的缓存或者服务层的缓存，因为这是两个不会经常发生状态变更的区域。”

Indelicato认为需要对服务层进行足够的抽象，这样当需求增加时，我们可以很容易地从服务的内部实现切换到进程之外的实现。

有些人认为在构建应用程序的时候不需要考虑可伸缩性问题，因为那会在必要的时候得到强调。但是如果我们想要从开始就考虑可伸缩性，你还有什么好的建议呢？

智布道 2024-08-13 12:02

不管是谁在打平安县城，我三五八团一定帮帮场子！

加百列Gabriel 2024-09-14 13:50

各位不要急着更新, 更新完之后linux虚拟机不支持3D加速了

优秀良民 2024-07-10 16:17

明明能躺平，明明可以割韭菜，还花钱研发？为了找骂？说这个能割韭菜？你被割了？你买了吗？是谁年年换mac，是谁年年换iphone？华为的用户好像没有那么干的吧？真让我一个小米用户都看不下去了！

我要探索宇宙 2024-09-16 14:43

3.5.2版本，队列redis能用集群模式的redis吗？

Kevin586 2024-07-29 17:09

真降低成本还是得换go，java太吃内存了

来开源啊 2024-09-14 15:07

25× 23.1 √

yh2216 2024-09-14 10:24

wps确实做的很棒，比微软的office好用，比libreoffice好用很多。wps加油，鸿蒙做的不错，继续加油，支持生态建设。

大后锋 2024-07-10 14:03

然后交警找责任方，打过去是牛逼高大上的生成式AI的客服

平波 2024-09-14 19:01

你了做过为为的项目啊；😂

开源中国首席路人王 2024-09-15 15:47

ipv6 tomcat需要改什么支持吗

黑人牙膏 2024-07-21 12:12

真的人不要脸则无敌，只要他不尴尬，尴尬的是别人。

字节跳动开源 2024-09-14 16:05

可以的，可以看看发布的一些用户案例

平波 2024-09-14 15:57

我倒是觉得好用，像真人就行；我可不希望它是真正的智慧生物；深度这些东东，本质就是曲面建模和贝叶斯/马尔科夫链这种概率建模；只要知识量够大，算力够强，机器就越像人；它有没有意识，并不重要；因为人的意思，估计也是伪命题；

longzz 2024-09-14 11:04

🤣65岁还在写代码吗？

奶奶灰 2024-09-15 20:28

换kvm 了

fasiondog 2024-09-14 17:26

👍

kushu001 2024-08-14 15:24

为什么一定要强调“国产”？是开源的项目么？如果开源，是不是不接受国外开发者的贡献？我只是好奇，不带“国产”，是宣传不了了么😀

我有我可以 2024-07-09 11:40

喷子们之所以喷，其本质是为自己的阴暗和自卑找理由罢了。

阳光满地 2024-09-15 00:25

加个证书那么简单的事，为什么还要等下一步再优化呢？

开源博客 2024-09-14 22:13

Virtualbox新管网使用vw布局单位，高分屏上使用浏览器的缩放没效果，字体仍老大==

fastfail 2024-09-15 08:37

捞钱捞到手抽筋

dwingo 2024-07-18 10:12

不是不让用jni和unsafe啊, 只是做了"限制", 只要加命令行参数就能继续用, 目的是为了让使用者考量程序的安全性.

封神梦 2024-09-14 17:53

反正wps就是各种vip广告，挺恶心人的

0day 2024-07-21 11:52

一个流氓也配谈安全？

天

天1天1天 2024-09-14 16:56

文章写的也没错，至于是不是steam的功劳，也无所谓，反正能玩了。

songdragon 2024-08-14 13:11

这个对比的条件还存在好几个问题。 1. solon使用的是smart-http，spring使用的是undertow 2. solon启动本身的自动配置少于spring 这两点就决定了对比的维度不同，性能更好的原因大概率是web服务器、应用配置依赖导致的。如果要拉齐，需要使用同样的web服务器，spring应用排除掉所有的自动配置，只保留web必须的，才能说明框架的性能差距。现在这个结果，无法说明solon本身性能好。