感谢大家的帮助。我对此主题的回答已经提出了许多有趣的观点和见解。
Cloud Console没有报告错误的事实使我相信瓶颈是在实际请求处理之后发生的。
我发现了结果不如预期的原因:带宽。
每个响应的有效负载大约为1MB,因此响应来自同一客户端的500个同时连接会阻塞线路,从而导致超时。向带宽大得多的VM请求时,显然没有发生这种情况。
现在,GAE缩放比例符合我的预期:它可以成功缩放以适应每个传入的请求。

感谢大家的帮助。我对此主题的回答已经提出了许多有趣的观点和见解。
Cloud Console没有报告错误的事实使我相信瓶颈是在实际请求处理之后发生的。
我发现了结果不如预期的原因:带宽。
每个响应的有效负载大约为1MB,因此响应来自同一客户端的500个同时连接会阻塞线路,从而导致超时。向带宽大得多的VM请求时,显然没有发生这种情况。
现在,GAE缩放比例符合我的预期:它可以成功缩放以适应每个传入的请求。