Table of Contents
OpenAI wypuściło własnego Agenta AI: Operator.
Operator może wykonywać zadania takie jak rezerwacja podróży, zamawianie produktów i dokonywanie rezerwacji, bezpośrednio wchodząc w interakcje ze stronami internetowymi za pośrednictwem przeglądarki.
Operator może również robić zrzuty ekranu, pisać, klikać, a nawet przewijać strony internetowe, aby realizować zadania.
Wykorzystuje kombinację rozpoznawania obrazów i zaawansowanego rozumowania, aby nawigować i wchodzić w interakcje z interfejsami internetowymi.
Oto kluczowe funkcje i informacje o Agencie AI 'Operator' od OpenAI:
Możliwości:
Wykonuje akcje w przeglądarce, aby wykonywać dla Ciebie zadania.
Bezproblemowo współpracuje z istniejącymi stronami internetowymi bez konieczności specjalnej integracji.
Może obsługiwać zadania takie jak:
Rezerwacja podróży i rezerwacje w restauracjach.
Zamawianie artykułów spożywczych i dostawa jedzenia.
Automatyczne wypełnianie formularzy.
Zakupy na wielu stronach.
Uruchamianie wielu zadań jednocześnie.
Zapamiętywanie Twoich preferencji.
Techniczne aspekty:
Wykorzystuje możliwości wizyjne GPT-4 do rozumienia stron internetowych.
Uczy się na podstawie zachowań użytkownika podczas wykonywania zadań.
Ma już partnerstwo z usługami takimi jak DoorDash, Instacart i Uber.
Przyjazny dla programistów: API będzie wkrótce dostępne.
Dostęp i dostępność:
Obecnie dostępny dla użytkowników Pro w USA (200 USD/miesiąc).
Planowane rozszerzenie na subskrypcje Plus, Teams i Enterprise.
Termin wprowadzenia w Europie nie jest pewny, ale potwierdzony na przyszłość.
Ograniczenia:
Nie obsługuje płatności ani logowań.
Ma trudności ze złożonymi interfejsami i CAPTCHA.
Posiada dzienne limity użytkowania.
Dowiedz się więcej na blogu OpenAI: https://openai.com/index/introducing-operator/
Deepseek R1 - nowy lider LLM ?
DeepSeek AI zaprezentowało swoje najnowsze dzieło, DeepSeek-R1, które robi furorę w społeczności AI open-source. Model ten został zaprojektowany z naciskiem na zdolności rozumowania, mając na celu dorównanie lub przekroczenie wydajności modelu o1 od OpenAI w różnych testach porównawczych.
Oto, co wyróżnia DeepSeek-R1:
Wydajność: DeepSeek-R1 wykazał niezwykłe wyniki, szczególnie w zakresie wnioskowania logicznego, rozumowania matematycznego i rozwiązywania problemów w czasie rzeczywistym. Został przetestowany na znanych testach porównawczych, takich jak American Invitational Mathematics Examination (AIME) i MATH, gdzie osiągnął wyniki równe lub lepsze od OpenAI o1.
Efektywność kosztowa: Jednym z najbardziej przekonujących aspektów DeepSeek-R1 jest jego przystępność cenowa. Programiści mogą uzyskać dostęp do jego możliwości za ułamek kosztów podobnych, zastrzeżonych modeli, a ceny API są ustawione na poziomie 5-10% ceny API OpenAI o1. Ta opłacalność sprawia, że zaawansowane rozumowanie AI staje się bardziej dostępne dla szerszej publiczności.
Zaangażowanie w Open Source: W przeciwieństwie do wielu topowych modeli, DeepSeek-R1 jest open-source, przestrzegając licencji MIT, która promuje komercyjną opłacalność. Ta otwartość nie tylko sprzyja innowacjom, umożliwiając programistom modyfikowanie i ulepszanie modelu, ale także pozycjonuje DeepSeek jako lidera w przejrzystej i dostępnej technologii AI.
Innowacyjna Architektura: Model wykorzystuje architekturę mieszanki ekspertów (MoE) z 671 miliardami parametrów, co jest znaczące ze względu na jego zdolność do wydajnego obsługiwania różnorodnych zadań. Architektura ta pozwala na wykorzystanie wielu sieci neuronowych wyspecjalizowanych w różnych zadaniach, optymalizując wydajność poprzez mechanizm routingu, który kieruje zapytania do najbardziej odpowiedniej sieci.
DeepSeek-R1 stanowi krok naprzód w kierunku demokratyzacji zaawansowanego rozumowania AI, czyniąc go modelem wartym obserwacji w nadchodzących miesiącach.
Szczegóły i link do bezpłatnego użytku: https://chat.deepseek.com/
Perplexity Assistant: Agentowy Asystent AI na Androida
Perplexity uruchomiło Perplexity Assistant, mobilnego asystenta opartego na AI, dostępnego wyłącznie dla użytkowników Androida. Ten asystent nie służy tylko do odpowiadania na pytania; został zaprojektowany, aby płynnie integrować się z Twoją codzienną rutyną, wykonując zadania w różnych aplikacjach.
Oto bliższe spojrzenie na to, co oferuje Perplexity Assistant:
Wielomodowe Możliwości: Asystent potrafi interpretować zarówno tekst, jak i dane wizualne, co czyni go wszechstronnym. Na przykład, może "widzieć", co jest na Twoim ekranie, lub użyć Twojego aparatu, aby identyfikować obiekty w czasie rzeczywistym, np. rozpoznać kartę Pokémon z Happy Meal.
Wykonywanie Zadań: Od ustawiania przypomnień po zamawianie przejazdów przez Ubera, pisanie e-maili, a nawet sugerowanie rozrywki, takiej jak podcasty na YouTube, Perplexity Assistant automatyzuje przyziemne zadania. Może wchodzić w interakcje z aplikacjami takimi jak Spotify, YouTube i Uber, chociaż jego kompatybilność jest wciąż rozszerzana.
Interakcja z Użytkownikiem: Aby korzystać z Perplexity Assistant, zastępujesz swojego domyślnego asystenta tym AI. Dostęp jest prosty; możesz przesunąć palcem w górę z lewego rogu ekranu lub przytrzymać przycisk Home.
Freepik to niesamowity kombajn Generatywnej AI
Freepik wprowadził niesamowite aktualizacje, które pozwalają tworzyć i edytować... dosłownie wszystko, czego możesz potrzebować:
Freepik ulepszył funkcję Retusz o Flux AI, umożliwiając spójność postaci jednym pociągnięciem pędzla, rewolucjonizując możliwości edycji obrazów opartej na sztucznej inteligencji.
Integracja najnowszego trybu MiniMax z Retuszem zapewnia doskonałe połączenie edycyjne, oferując użytkownikom zaawansowaną kontrolę nad modyfikacjami obrazu.
Ta aktualizacja wpisuje się w trend narzędzi AI stających się bardziej przyjaznymi dla użytkownika i potężniejszymi, co widać po ostatnich postępach w technologii generowania obrazów AI.
Pakiet AI Freepik zawiera teraz tę przełomową aktualizację, dzięki czemu tworzenie wysokiej jakości, spójnych postaci jest dostępne dla szerszej publiczności.
Freepik zintegrował również Imagen 3 od Google i Flux Pro ze swoim pakietem AI, zapewniając najwyższej klasy generator tekstu na obraz, który przoduje na rynku z znaczną przewagą wydajnościową.
Nowe Narzędzia AI
OpenAI Operator
Narzędzie zaprojektowane przez OpenAI do autonomicznego wykonywania zadań internetowych. Może obsługiwać zadania takie jak rezerwacja lotów lub dokonywanie rezerwacji, zwiększając produktywność poprzez automatyzację interakcji internetowych.
Fellow
Fellow to narzędzie AI, które pomaga w zarządzaniu spotkaniami, oferując funkcje takie jak generowane przez AI notatki ze spotkań, elementy akcji i możliwość wspólnej edycji. Jest idealne do utrzymywania spotkań zorganizowanych i produktywnych.
Sembly AI
Sembly AI oferuje pomoc w spotkaniach opartą na AI, w tym transkrypcję, podsumowywanie i analizę spotkań. Pomaga w wyodrębnianiu kluczowych punktów i elementów akcji, ułatwiając działania następcze.
Tldv
Tldv jest przeznaczony do podsumowywania spotkań wideo i rozmów, zapewniając zwięzłe przeglądy i kluczowe punkty, co jest nieocenione w zarządzaniu czasem i nadrabianiu zaległych dyskusji.
Assembly AI
Assembly AI koncentruje się na przetwarzaniu mowy na tekst i przetwarzaniu języka naturalnego, oferując usługi transkrypcji o wysokiej dokładności dla różnych zastosowań, od obsługi klienta po tworzenie treści.
Vmake.ai
Vmake.ai to narzędzie AI do tworzenia i edycji wideo, umożliwiające użytkownikom łatwe tworzenie profesjonalnej jakości filmów poprzez automatyzację znacznej części procesu produkcji wideo.
