Umgang mit Rate Limits implementieren
TrailBlaze, eine KI-gestützte Buchungsplattform für Abenteuerreisen, hat vor Kurzem einen Chat-Assistenten entwickelt, der bei neuen Flugdeals eine Flut von Fragen zu Reiserouten erhält. Du baust eine Hilfsfunktion, die mit Bedrock-Throttling zurechtkommt, indem sie ein exponentielles Backoff hinzufügt.
Die Bibliotheken json, time und boto3 sind vorab geladen. Der bedrock-Client und die model_id sind ebenfalls vorab geladen.
Diese Übung ist Teil des Kurses
Einführung in Amazon Bedrock
Anleitung zur Übung
- Vervollständige die API-Request-Zeichenfolge mit dem Prompt.
- Implementiere exponentielles Backoff.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
def smart_retry(prompt, max_attempts=3):
base_delay = 0.5
for attempt in range(max_attempts):
try:
# Complete the API request string with the prompt
response = bedrock.invoke_model(
modelId=model_id,
body=json.dumps({"anthropic_version": "bedrock-2023-05-31", "max_tokens": 100,
"messages": [{"role": "user", "content": [{"type": "text", "text": ____}]}]}))
return json.loads(response["body"].read().decode())["content"][0]["text"]
except Exception as e:
if "ThrottlingException" in str(e):
# Implement exponential backoff
time.sleep(____)
else: raise e
return "Max retries exceeded"
print(smart_retry("Tell me about hiking in Patagonia."))