内网比外网延迟高、客服说符合预期、你敢信、腾讯云离谱日常

8个月前 (02-25)其他102

前置信息

轻量服务器:  广州四区

云MySQL数据库: 广州七区

数据库购买于 2024-10-23 ( 活动价 49元/年 同价续费1年 )

问题概要

轻量服务器通过( 内网IP )内网互联访问数据库时延迟比通过外网 ( 域名或公网IP ) 高3倍

这显然不符合常理、即使他们内网互联是走的公网隧道、也不至于会比直接走公网高那么多

问题分析

由于数据库的内网IP无法Ping 

我这里以多种方式来进行测试

  1. 通过tcping 内网延迟4毫秒 外网延迟0.9毫秒

QQ20250225-144351.jpg

2.通过 Uptime Kuma 监控 内网延迟15毫秒 外网延迟5毫秒

这种监控会连接数据库并执行命令、所以延迟比tcping高是正常的

3.通过实际业务操作数据库来计算耗时

连接100次耗时 内网: 1807毫秒  外网:539毫秒


不管我以何种方式测试、内网延迟都是比外网延迟高的

同期我也试过买同区同配置的数据库、内网延迟是比外网延迟低的

内网 广州四区单节点 连接100次耗时:322.3毫秒

外网 广州四区单节点 连接100次耗时:1926.9毫秒

双节点的也试过

广州三区-双节点,内网连接100次耗时:279.29毫秒

广州三区-双节点,外网连接100次耗时:795.63毫秒

无奈单节点数据是不支持迁移可用区的

起初我并没有打算反馈这个问题、因为我知道腾讯的工单客服智商堪忧

要跟他们沟通非常费时费力、每次都会一肚子火气

再加上本身非常便宜、也不是不能用、就将就着用了


直到2025-02-18我朋友直到我这个事后非要我跟腾讯反馈

于是战斗开始了

我们提工单说明问题、并表示购买同配置的广州四区时延迟是正常的、

诉求是: 帮我迁移到广州四区、或者退代金卷我自己重新买四区

客服多次回复: 您的广州七区的数据库为单节点,不支持更换可用区

我: 那就退卷我自己重新买

客服不理会、转高级工程师排查问题

然后回复如下内容: 

关于您反馈的延迟问题,需要您协助在故障时间做下网络测试,网络测试的方法您可以参考如下文档:

网络测试教程:https://cloud.tencent.com/developer/article/1468122

MTR工具使用说明:https://cloud.tencent.com/developer/article/1035350

烦请您将网络测试做完后,提供正反向测试的6张截图,我们为您做进一步排查分析,感谢您的支持。

我看了下测试教程

一般网络测试时会需要7张测试的截图,分别是:

1)本地端  ping  服务端;

2)服务端  ping  本地端;

3)本地端  向  服务端做路由追踪;

4)服务端  向  本地端做路由追踪;

5)本地端  向  服务端做MTR测试;

6)服务端  向  本地端做MTR测试;

7)本地端访问ping.huatuo.qq.com,获取本地外网出口IP地址;

因为网络传输数据都是双向的,所以上面的6点可以说是3对正反向测试;

顿时血压就上来了、他们要的6张截图一多半都没法测试

服务端向客户端的测试我们是没法做的 ( 从数据库Ping服务器和路由追踪和MTR)

他们内网IP无法Ping、难道他们自己不知道吗 ( 起初我还不确定是不是我自己的问题、后来我朋友北京区的也是无法ping )

路由测试和MTR测试也都无法进行

但既然他们要求了、我们照做就行了

提供一些无意义的测试截图

加上我自己Uptime Kuma 监控的截图和tcping的截图

然后就是继续等他们核实

然后他们又让我 收集内网的mtr 我表示前面已经提供过截图了 并告知我

并表示他们内网延迟监控它盘是正常的

继续各种等

然后高级工程师给我来电话

表示认可我提供的测试结果、确实内网延迟比外网高

然后跟我说了句、我那个tcping外网快可能是代答 ( 我的理解是应答的不是数据库而是其他的 )

我并不认可他这个说法、因为我其他测试、包括实际业务都证明了内网比外网延迟高

然后他们继续排查、一天后、

他们得出结论了、之所以延迟高

我买的七区、但后端实际绑定的是三区

通过内网访问时先经过七区在到达三区、所以延迟高

他们也没表示可以帮我迁移可用区、

那我就要求退卷我自己重新购买、高级工程师表示帮我反馈

但到了工单客服这边他们又不认了、说工程师没了解清楚我的情况

因为我是活动买的、他们只能退我购买的金额、

这样退我根本不够在控制台购买其他区

我自然是不同意的、

让我去点活动页面的购买截图给他们看

问题是我已经购买了根本就没有购买可以点击

只能点续费、问题僵在这了

迁移他们没法迁移、退卷不给退足够买同配置同到期时间的卷

我回复说那你就在我账号上添加一个四区的数据库、把七区的收回去

他们又说没法操作、

在我的坚持下他们跟后端沟通了下、回复说

您好,这里后端评估了下,不能给您在您的账号下新建实例,但后端可以迁移下这个实例,迁移到4区,迁移最后切换的时候会有一个秒级的闪断,业务有重连机制即可,您看现在可以操作吗

终于有希望了、我赶紧就同意了、过了会回复我说迁移完成了

然我测试下有没有改善、

我测试了下

内网连接100次耗时:348毫秒

外网连接100次耗时:466毫秒

但我在控制台看到的还是七区、于是多嘴问了一句、是否正常

结果他们跟后端核实后说法有变了

您好,这边跟后端再次核实了下,因为活动配置的是7区,我们不能直接将实例迁移到4区,刚才我们后端操作的是把实例从3区迁移到7区,这样避免跨可用区来访问,减少网络延迟,所以实例控制台上显示7区是符合预期的,您这边访问没有延迟即可呢。

好家伙、这客服就没一句话是靠谱的、整个沟通过程乱七八糟的

下面会所要补偿的过程


到这里问题就已经实锤了、是因为他们挂羊头卖狗肉、我买的七区为什么要给我部署到三区、部署到三区就算了、为什么要经过七区访问、从而导致我几个月以来的使用体验都非常糟糕

提出要补偿后他们回复说补偿10元、我特么的笑了、工单时间超过24小时、除去睡觉时间十几个小时、我特么除去见垃圾都不止10元

客服: 您好,这边跟产品侧申请了下,出于对您的产品使用体验感考虑,产品侧同意可以给您补发个10元的代金券,您看可以嘛,可以的话这边来给咱们申请下呢

我: 我这个业务几个月都不正常,你补偿最起码要能让我买点东西吧,十块钱能买什么?

客服: 后边您有购买实例或者续费的操作都是可以直接用这个代金券来抵扣的,因为这个实例是活动购买的,本身购买只花费59元,代金券申请也是需要审批的,大额代金券产品侧也不好申请呢,如您同意10元代金券的话,这边来给咱们申请下,希望得到您的理解与支持

我: 申请个30元的吧~~~我这边陪着你们折腾了2天,本来很简单就可以给我处理的,你们搞了这么久

服: 非常抱歉,因为实例是59元购买一年,且您是使用了代金券10元,现金支付49元购买的,30元的代金券这里真的不好申请,期待您的理解与支持

我: 按照你这个理论、我10块钱买的包子、吃坏身体了、你们最多就只能赔2元了呗?  昨天沟通到现在、不算睡觉时间也有十几个小时、我十几个小时出去捡瓶子都不止10元、更何况你这是10元代金卷、还得倒贴钱才能买到东西、要么你就直接给我数据库续费1个月、我不要你的10元代金卷、因为没用、给了跟没给一样

我: 你别老是按照你的想法作为评判的标准、你说单节点无法迁移最终迁移了、你说你们大盘监控符合预期,最终工程师说买的七区实际部署的是三区、绕路了所以延迟高、你去申请就行了

然后他就去申请了、也批下来了


至此结束、我说说我对整件事情的看点和评价

工单客服非常弱智、为什么这么说呢? 以下几点

  1. 搬文档说单节点不可更换可用区、 能自己更换我早就自己更换了、犯不着跟他们沟通

  2. 搬文档如何测试网络、反向测试我们根本没法做、正向测试也因为他们限制无法进行、测个寂寞

  3. 已经提供的测试截图、又让提供、不认真、测试截图也可以看到外网域名对应的IP、又来问我是不是数据库的IP、无效沟通浪费时间

  4. 跟我说他们大盘监控的内网延迟是正常的、可不是嘛、你监控是四区到七区的、而不是四到七在到三的、你监控肯定正常啊

  5. 说后端可以迁移到四区、结果实际是迁移到七区、做事就这么不靠谱的吗

  6. 跟我说内网延迟符合预期、特么的符合谁的预期、说这话不害羞吗

  7. 各种离谱的事搞我心态浪费我时间、居然好意思只补偿10元

  8. 工单客服一直按照想法作为评判的标准、显然这非常打脸


产品设计非常不合理、虽然是活动价可能没钱赚或者是亏钱、但你可以不卖啊

没人强迫你们这样卖吧、或者明着说出来、我们活动款就是这么垃圾、就是买七区实际是三区、就是内网延迟比外网高、就是要绕路

用户知情了、可以选择不买、我不买就不会浪费时间去测试、浪费时间去沟通

既然什么都没说、那就应该保证产品合理、而不是说内网延迟符合预期、各种沟通困难

对于我来说、是非常抗拒提工单的都会因为处理工单的客服真的很智障、

包括我之前用他们产品出现bug导致服务器一直被攻击 ( 他们说是探测 )

沟通都是非常恶心人的、处理工单的人要技术没技术、甚至说连基本常识都没有

又不能直接和高级工程师沟通、他们就最个传话筒


另外有些人可能会说、既然外网延迟低你为什么不用外网? 

第一、数据库开外网并不是什么好事、存在安全问题

第二、外网因为是对外开放的、难免会存在被攻击等问题造成不可用或网络波动

第三、虽然外网延迟低可以正常使用、但内网实际会更低、我肯定希望用延迟更低的


补充 250317

由于我朋友和他们领导提到我这个事 ( 我是这么认为的 )、得到以下回复:

和客服、产品分别沟通了下,这个问题发生的很偶

然,客服没有第一时间定位到问题,转产品后多团队

共同定位问题消耗了一些时间才找到解决办法,所以

处理时间长了些。当前问题已经排期解决,预计4月

底发布到现网。

也有客服打电话给我道歉、并重新补偿了200元代金卷