
Производител на сладолед у нас закрива бизнеса си и се мести в Румъния
Фабриката обяви масово съкращение на работници
Дори собственият AI модел на Google се представя по-добре на iOS
Ново проучване показва, че изкуственият интелект работи много по-добре с мобилната платформа на Apple, отколкото с Android на Google, пише Business Insider.
Софтуерната компания Instabug създаде инструмент на име SmartResolve, който използва водещи AI модели, за да автоматизира процеса на откриване на сривове в приложения, диагностициране на проблемите и генериране на работещи софтуерни корекции.
Те са използвали модели от OpenAI, Anthropic, Google и Meta върху набор от данни с реални сривове на приложения. Всяка корекция е била оценена по точност, сходство с човешки поправки, дълбочина на анализа на коренната причина, релевантност и обща последователност.
Основното заключение, направено от компанията, е че AI моделите последователно показват по-добри резултати на iOS, отколкото на Android. Instabug установи и че на платформата на Apple корекциите на сривове са по-точни, последователни и добре структурирани при почти всеки тестван модел.
Моделите на OpenAI, например, показват значително по-добри резултати на iOS. GPT-4o постигна 60% на iOS срещу 49% на Android. При моделa o1 на OpenAI разликата беше още по-голяма - той достигна 62% на iOS, но падна до 26% на Android, като често изцяло не отговаряше в тестовете на Android.
Други модели следваха подобна схема. Моделът на Anthropic, Claude Sonnet 3.5 V1, постигна 58% на iOS и 56% на Android — по-малка разлика, но все пак отново водеше iOS.
Дори собственият модел на Google Gemini 1.5 Pro се представи по-зле на Android (51%), отколкото на iOS (59%). Instabug установи, че той също среща повече проблеми с халюцинации при използване му.
Според експерти разликата може да се дължи на фрагментираната екосистема на Android. В сравнение с iOS, който предлага по-единна среда, по-широкият набор от устройства и типове сривове на Android може да затрудни AI моделите да обобщават корекциите.
„По-силното представяне на iOS е частично заради структурата на езиците на iOS като Swift и Objective-C. Тяхната синтаксис е по-предсказуем и строго типизиран, което улеснява LLM моделите да генерират точни корекции“, каза Кени Джонсън, главен продуктов директор на Instabug.
Джонсън обясни, че езиците на Android — Java и Kotlin — заедно с променливостта на формата на сривовете водят до по-висока сложност при корекциите.
Apple и Google не са отговорили на запитванията на Business Insider за коментар.
Последвайте businessnovinite.bg в INSTAGRAM
Последвайте businessnovinite.bg във FACEBOOK
Последвайте businessnovinite.bg в LINKEDIN
Фабриката обяви масово съкращение на работници
Индустрията е оценена на 80 милиарда долара
Целта е да се улесни потребителското сравнение в реално време