بر اساس منابع ارائه شده، Suna AI یک عامل هوش مصنوعی عمومیگرا (generalist AI agent) و متنباز (open-source) است که توسط Kortix AI توسعه یافته است. این عامل با هدف اقدام کردن از طرف کاربر و انجام کارهای واقعی از طریق مکالمه با زبان طبیعی طراحی شده است. منابع به وضوح بیان میکنند که Suna فقط یک چتبات نیست، بلکه یک پلتفرم قابل توسعه است که برای تعامل با سیستمهای دیجیتال مختلف، خودکارسازی گردش کار و ارائه نتایج ملموس بر اساس درخواستهای کاربر ساخته شده است. ایده اصلی پشت Suna پل زدن شکاف بین هدف انسان که از طریق مکالمه بیان میشود و اقدامات مشخص است که توسط هوش مصنوعی انجام میگردد.
در زمینه بزرگتر Suna AI همانطور که در منابع توضیح داده شده، قابلیتهای اصلی آن شامل پذیرش دستورالعملهای زبان طبیعی، تفسیر درخواستها، برنامهریزی توالی اقدامات و استفاده از مجموعه ابزارهای داخلی برای اجرای برنامه است. این ابزارها شامل خودکارسازی مرورگر برای تعامل با وبسایتها، مدیریت فایلها در محیط امن، خزش وب و جستجوی پیشرفته، اجرای دستورات خط فرمان، یکپارچهسازی API با خدمات شخص ثالث و تفسیر کد (عمدتاً پایتون) است. Suna هوشمندانه این قابلیتها را برای انجام گردش کار پیچیده به هم متصل میکند. موارد استفاده متنوعی برای Suna ذکر شده است، از جمله هوش تجاری، استخدام، رسیدگی به دادهها (مانند تولید گزارش و صفحهگسترده)، خودکارسازی (مانند ارسال ایمیلهای اولیه)، برنامهریزی سفر و جمعآوری اطلاعات هدفمند. این نشان میدهد که Suna میتواند به عنوان دستیار تحقیق، تحلیلگر داده، کمککننده اداری و موتور خودکارسازی عمل کند. همچنین اشاره شده است که Suna میتواند برنامهها، ابزارها، وبسایتها و حتی بازیها را بسازد.
معماری Suna ماژولار است و از چهار مؤلفه کلیدی تشکیل شده است:
رابط کاربری (Frontend): یک برنامه وب Next.js/React که نقطه اصلی تعامل کاربر است و رابط چت و داشبورد را فراهم میکند.
API بکاند: با استفاده از Python و FastAPI ساخته شده و منطق اصلی را مدیریت میکند، از جمله مدیریت درخواستهای کاربر، وضعیت مکالمه و یکپارچهسازی با مدلهای زبان بزرگ (LLM).
محیط Docker عامل (از طریق Daytona): جایی که هر کار عامل در یک کانتینر Docker ایزوله برای اجرای ایمن ابزارها اجرا میشود.
پایگاه داده Supabase: یک پایگاه داده PostgreSQL که لایه پایداری را فراهم میکند. این مؤلفه احراز هویت کاربر، مدیریت کاربران، تاریخچه مکالمات، ذخیرهسازی فایل و تجزیه و تحلیل وضعیت عامل را انجام میدهد. همانطور که در مکالمه قبلی ما ذکر شد، Supabase بخش ضروری از معماری Suna است و برای راهاندازی آن، به ویژه در سناریوی خود-میزبانی، مورد نیاز است.
منابع به یکپارچهسازی Suna با مدلهای زبان بزرگ اشاره میکنند و توضیح میدهند که این یکپارچهسازی، همراه با مکانیسمهای قوی مدیریت ابزار، به Suna امکان میدهد تا درخواستها را درک کرده و اقدامات لازم را انجام دهد. Suna با LLMهای مختلفی مانند Anthropic (توصیه شده) و OpenAI کار میکند و میتواند با مدلهای دیگری از طریق litellm ارتباط برقرار کند.
یکی از مزایای کلیدی Suna که در منابع برجسته شده است، ماهیت متنباز آن است که امکان خود-میزبانی (self-hosting) پلتفرم را فراهم میکند. راهاندازی محلی نیازمند تنظیم مؤلفههای مختلفی مانند Supabase، Redis و Daytona و همچنین کلیدهای API برای LLMها و خدمات اختیاری است. با وجود اینکه راهاندازی ممکن است شامل چندین مرحله و نیازمندی باشد، خود-میزبانی کنترل کامل بر نمونه Suna، دادهها و هزینههای عملیاتی را فراهم میکند. همچنین یک نسخه میزبانی شده از Suna در دسترس است، اما استفاده رایگان از آن ممکن است محدود باشد.
منابع Suna را با سایر عوامل هوش مصنوعی مانند Manus و Genspark مقایسه میکنند و آن را به عنوان یک جایگزین قدرتمند معرفی میکنند. در حالی که برخی منابع تجربه استفاده و راهاندازی خود-میزبانی را چالشبرانگیز یا دارای باگ توصیف میکنند، سایر منابع بر قابلیتها و پتانسیل آن به عنوان یک عامل هوش مصنوعی که میتواند وظایف پیچیده را به صورت خودکار انجام دهد، تأکید دارند.
Share this post