Web Retrieval w Prompt Builder: brakujący element RAG w Salesforce
- 27 marca 2026
W orgach rośnie presja, by AI podejmowała decyzje na aktualnych danych, a nie wytrenowanych modelach sprzed kilkunastu miesięcy. Tymczasem 90 procent promptów w Agentforce nadal operuje wyłącznie na Salesforce CRUD i Data Cloud. Nowa funkcja web retrieval w Prompt Builder (Salesforce) zmienia ten stan gry, umożliwiając wstrzykiwanie live danych z zewnętrznych źródeł bez budowania własnych RAG pipelines. Poniższy tekst pokazuje, jak działa ta architektura, jakie ma ograniczenia i co musi wiedzieć każdy architekt, konsultant i developer projektujący automatyzacje AI w Polsce.
Największym ograniczeniem modeli LLM jest fixed training cutoff i brak dostępu do aktualnych danych. W polskich projektach często oznacza to, że agent AI generuje rekomendacje sprzedażowe bez najnowszych informacji o konkurencji, a w service bez aktualnych wytycznych regulatora KNF czy UODO. Web retrieval w Prompt Builder rozwiązuje ten problem, wprowadzając możliwość pobrania i osadzenia live treści z wybranych providerów zanim prompt trafi do modelu. Salesforce zaprojektował to jako natywną część pipeline’u, a nie addon, co daje przewagę nad własnoręcznie klejonym RAG.
Architektura opiera się na tym, że Prompt Builder potrafi orkiestracyjnie uruchomić kilka providerów danych – zarówno Salesforce (record data, Data Cloud), jak i zewnętrzne źródła – a następnie skleić je w jeden resolved prompt. W efekcie model otrzymuje pełny kontekst operacyjny bez konieczności budowania własnych indeksów czy embeddingów. To oznacza niższe koszty utrzymania i mniej punktów awarii.
Implikacja dla praktyków jest jasna: web retrieval to pierwszy element enterprise RAG wbudowany w Agentforce i jednocześnie sygnał, że Salesforce zmierza do modelu opartego na kompozycji providerów danych, nie fine-tuningu. Jest to spójne z kierunkiem Agentforce MCP, gdzie AI działa na deterministycznych narzędziach bez kontekstowego bloatu. Ten trend opisaliśmy wcześniej przy okazji architektury MCP w Agentforce.
W wywiadzie Salesforce szczegółowo opisuje założenia inżynieryjne stojące za web retrieval: wysoką niezawodność, łatwość użycia i bezpieczeństwo. Użytkownik dodaje retrieval do promptu jak każdy inny data provider – bez pisania kodu. System odporny jest na timeouty i opóźnienia providerów, tak aby nie blokować pozostałych elementów pipeline’u. To kluczowe w polskich orgach, gdzie część źródeł informacji działa na niestabilnych API i trzeba zarządzać ryzykiem SLA bez ingerowania w logikę promptu.
Najciekawszy element to warstwa filtrów bezpieczeństwa i sanityzacji danych. Zewnętrzne treści mogą być toksyczne, niebezpieczne lub zaburzające model, dlatego zanim trafią do resolved prompt, przechodzą przez filtry, które usuwają niechciane fragmenty. Jest to identyczny mechanizm, jaki Salesforce stosuje w Slackbot MCP przy integracjach ze źródłami firm trzecich.
W praktyce oznacza to, że web retrieval działa jak modularny komponent RAG: pobiera treść, oczyszcza ją, taguje metadanymi i dokleja do promptu. Bez indeksowania, bez wektorów, bez runtime embeddings. To świetnie sprawdzi się przy workflowach, które wymagają aktualizacji, ale nie powtarzalnego przeszukiwania ogromnych zasobów. Gdy potrzebne jest pełne RAG (np. praca na tysiącach PDF), bardziej sensowne jest użycie agentów opisanych w tekście o AI czytającym PDF i obrazy w Service Cloud.
Największym problemem produkcyjnych wdrożeń LLM są halucynacje. Salesforce adresuje to, wprowadzając do Prompt Builder architekturę generowania i osadzania cytacji. System zbiera metadane retrievalu (skąd pochodzi fragment, jakie źródło, jaki timestamp), a następnie citation service przetwarza całą odpowiedź i dodaje znaczniki w odpowiednich miejscach. Kluczowy cytat ze źródła pokazuje, jak Salesforce postrzega tę funkcję:
„Additionally, citation capabilities allow generated responses to be traced back to the original sources that informed them.” (źródło: Salesforce)
Technicznie ciekawy jest fakt, że Salesforce stosuje strategię insertion w odwrotnej kolejności, aby nie przesuwać offsetów tekstu. Bez tego marker dodany na początku zrujnowałby referencje w kolejnych sekcjach. To detal, ale pokazuje enterprise-grade podejście: precyzja w generowaniu artefaktów ma wpływ na governance, audyt i zgodność z RODO.
W polskich wdrożeniach AI w obszarach regulowanych, takich jak finansowy, medyczny czy ubezpieczeniowy, to potencjalnie game changer. Cytacje umożliwiają weryfikację źródeł podczas audytu lub kontroli compliance i ograniczają ryzyko błędnych decyzji agentów AI. To również fundament przyszłych rozwiązań typu AGI governance, w których każda decyzja AI musi być wyjaśnialna. Trend ten jest spójny z rosnącą presją na deterministyczność, którą opisywaliśmy przy analizie kosztów autonomii AI w Agentforce.
Dla polskich architektów Salesforce najważniejszy wniosek jest prosty: web retrieval to pierwszy natywny sposób na łączenie danych wewnętrznych i zewnętrznych w ramach jednej automatyzacji bez budowania własnej infrastruktury. Oznacza to skrócenie czasu delivery, zmniejszenie długu technicznego i ograniczenie liczby komponentów, które trzeba utrzymywać. Równocześnie rośnie presja na dokumentowanie źródeł i compliance, co czyni cytacje nie opcją, ale standardem.
Praktyczna strategia wdrożenia obejmuje trzy kroki. Pierwszy: identyfikacja promptów, które obecnie halucynują z powodu zbyt ograniczonego kontekstu CRM. Drugi: ocena, które źródła zewnętrzne mogą być pobierane live, a które wymagają lokalnych polityk bezpieczeństwa i screening’u treści (szczególnie w sektorach regulowanych). Trzeci: wdrożenie governance dla cytacji, tak aby użytkownicy mogli weryfikować odpowiedzi w sposób powtarzalny i audytowalny.
Patrząc szerzej, web retrieval w Prompt Builder to krok w kierunku większej modularności w AI Salesforce. To zgodne z trendem opisanym w naszej analizie Agentforce 360, gdzie kluczowe jest budowanie kontekstu z wielu źródeł danych w czasie rzeczywistym. Można się spodziewać, że w 2026 i 2027 Salesforce rozwinie ten mechanizm o cache warstwowy, scoring providerów oraz dynamiczne wagowanie źródeł – tak aby prompt resolution pipelines były optymalizowane w czasie rzeczywistym.
To również punkt zwrotny dla roli admina i konsultanta. Wraz z rozszerzeniem Prompt Builder, praca nie polega już na pisaniu promptów, ale projektowaniu pipelines kontekstowych. Kompetencje będą przesuwać się w stronę kontroli źródeł i governance, a nie czystego prompt engineeringu.
Ostatecznie web retrieval i cytacje nie są dodatkiem, ale fundamentem dojrzałego enterprise AI. Salesforce wyraźnie buduje model, w którym AI nie odpowiada na podstawie intuicji LLM, ale na podstawie dokumentowanych dowodów. To sygnał dla polskich zespołów: projekty AI będą coraz bardziej audytowalne, mierzalne i weryfikowalne.