集思广益,上司提了个需求要短时间可以扛住 200 万 req/s

281 天前
 owen800q

先说下背景,跨境电商,主要是 tiktok 直播带货,我们是下游平台,平台技术架构是用 aws serverless lambda, api gateway 和 dynamodb

一开始 aws 是给了 3000 的 concurrency quota, 后来业务爆发性增长,年中时我们向 aws 申请加到了 5 万 lambda 并发数,本来以为应该可以应付一切了,但上星期日志出现了大量 500 internal server error, 原来是达到 5 万+了,我们问了下 aws 技术支持,说我们当天的峰值到达了 12 万+ req/s

导致大量商家无法创建下游订单, 大老板直接提了个要求是不允许再发生这种情况, 要求要扛住至少 200 万 请求

Api gateway 和 dynamodb 是没性应限制的,主要是 lambda 并发数提不上去, aws 那边说最多只能把 lambda 最大并发只能提到 100k

21801 次点击
所在节点    程序员
159 条回复
Lax
281 天前
下游无限制重试造成的吧。类似的东西,当年抢票插件把 12306 和 github 同时干趴下了。
tkHello
281 天前
换人?哈哈哈
tkHello
281 天前
我这有码,大家集思广益都 v 我 50 。
likunyan
281 天前
@ETiV 200 万,不是 5 万,WAF 不行吧,至少得 6 万一个月的 DDOS 防护。
hancai
281 天前
客户要求达到 2000 ,我们公司都头大
coderzhangsan
281 天前
订单业务,200 万 QPS ,你知道这意味着什么吗?对应的 TPS ,你们现有架构能撑住?可以考虑下有没有灌水或攻击吧,之前我司接快手广告投放引流(注册转化),非高峰期快手一小时回传了 30 万多有效广告点击数,实际注册转化数 58 。
zebedy
281 天前
1:你们峰值 12wqps 的流量很多都不是真实流量
2:你不知道能扛住 200w qps 意味着什么
Perry
281 天前
先看看是不是 retry storm 吧
thinkm
281 天前
被攻击了
SmiteChow
281 天前
我们一般说要优化 C10k ,你这上来就是 C2000k 啊
pkoukk
281 天前
200w?一粒一粒地卖沙子么.....
dusu
281 天前
是否包含所有资源请求 像图片/css/js
三方电商有 200w 纯 api 的请求
我也不太信
如果有 请剔除后再来确定你需要达到的上限
lovelylain
281 天前
雪崩了吧,你对于 12w/s 的请求量有多少认识,服务不是无限堆资源来多少处理多少的,建议先梳理业务实际请求量,各个环节的重试和防过载策略是否合理。
zjsxwc
281 天前
200 万 req/s 你带宽都要逆天了
Hyschtaxjh
281 天前
老板发财了 这么大的量 做梦都笑醒
zjsxwc
281 天前
@zjsxwc 按每个请求 2k 算
你需要 2000000 * 2 /1024/1024 * 8 = 30.518 约等于 32Gbps 的带宽。
32Gbps 的带宽 什么概念?

相当于 PCIe 3.0 x 4 ,最大理论速度,你这是网速,又不是读取 nvme 固体硬盘。
BaffinLee
281 天前
lambda 的限制是整个 aws 的限制还是你这个账号的限制?新建一个账号呢
murmur
281 天前
阿里的交易有效性才是 20w 交易每秒,你们 200w/s 你以为你是阿里全宇通么,先买高防吧,大概率是被黑产或者 d 了
Weedy152
281 天前
有点吓人了这个量,mark 一个看看各位大佬解法
sankooc
281 天前
电商业务 12w 的 qps 几乎接近双 11 了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.fyfyfm.apispeedy.workers.dev/t/1000267

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX