Google I/O 2024: 구글이 발표한 100가지
컨텐츠 정보
- 866 조회
본문
1. 우리는 규모에 맞춰 빠르고 효율적으로 서비스를 제공하도록 설계된 경량 모델인 Gemini 1.5 Flash를 출시했습니다. 1.5 Flash는 API에서 제공되는 가장 빠른 Gemini 모델입니다.
2. 우리는 광범위한 작업 전반에 걸쳐 일반적인 성능을 발휘하는 최고의 모델인 1.5 Pro를 대폭 개선했습니다.
3. 1.5 Pro와 1.5 Flash는 모두 Google AI Studio 및 Vertex AI에서 100만 개의 토큰 컨텍스트 창을 갖춘 공개 미리보기로 제공됩니다.
4. 1.5 Pro는 또한 Google AI Studio 및 Vertex AI 의 대기자 명단을 통해 개발자에게 200만 개의 토큰 컨텍스트 창을 제공합니다 .
5. AI 비서의 미래에 대한 비전인 Project Astra를 공유했습니다 .
6. 우리 는 맞춤형 AI 가속기인 TPU(텐서 처리 장치)의 6세대인 Trillium을 발표했습니다 . 현재까지 가장 성능이 뛰어난 TPU입니다.
7. TPU v5e에 비해 Trillium TPU는 칩당 최대 컴퓨팅 성능이 4.7배 향상되었습니다.
8. 또한 가장 지속 가능한 세대이기도 합니다. Trillium TPU는 TPU v5e에 비해 에너지 효율성이 67% 이상 높습니다.
9. 그리고 업로드된 자료 모음을 사용하여 사용자에게 맞춤화된 구두 토론을 생성하는 NotebookLM 용 오디오 개요의 초기 프로토타입을 시연했습니다 .
10. 우리는 Gemini 모델을 세계 지식, 광범위한 주제 또는 인터넷의 최신 정보와 연결하는 도구인 Grounding with Google Search가 이제 Vertex AI에서 일반적으로 사용 가능 하다고 발표했습니다 .
11. Gemini API 및 AI Studio에 오디오 이해 기능을 추가하여 이제 Gemini 1.5 Pro는 AI Studio에 업로드된 비디오의 이미지와 오디오를 추론할 수 있습니다.
12. Pixel을 시작으로, Multimodality를 갖춘 Gemini Nano를 사용하는 애플리케이션은 텍스트 입력뿐만 아니라 시각, 청각 및 음성 언어를 통해 사람이 하는 방식으로 세상을 이해할 수 있습니다.
생성적 미디어 모델 및 실험실 실험
13. 우리는 최고 품질의 이미지 생성 모델인 Imagen 3를 발표했습니다.
14. Imagen 3는 프롬프트 뒤의 자연어와 의도를 이해하고 긴 프롬프트의 작은 세부 정보를 통합합니다. 이를 통해 놀라운 수준의 디테일을 생성하고 이전 모델보다 방해가 되는 시각적 아티팩트가 훨씬 적으면서 사실적이고 실물과 같은 이미지를 생성할 수 있습니다.
15. Imagen 3은 텍스트 렌더링을 위한 최고의 모델이기도 합니다. 이는 이미지 생성 모델의 과제입니다.
16. ImageFX의 신뢰할 수 있는 테스터에게 Imagen 3를 출시했으며 등록하여 대기자 명단 에 등록할 수 있습니다 .
17. Imagen 3도 올 여름 Vertex AI 에 출시될 예정입니다.
18. 그리고 우리는 역대 가장 유능한 비디오 생성 모델인 Veo를 발표했습니다. 다양한 영화 및 시각적 스타일로 1분이 넘는 고품질 1080p 해상도 비디오를 생성합니다.
19. 또한 향후 Veo의 기능 중 일부를 YouTube Shorts 및 기타 제품에 도입할 예정입니다.
20. 우리는 영화 프로젝트를 위해 Veo를 실험한 Donald Glover를 포함하여 영화 제작자와 협력하여 아티스트가 Veo를 도울 수 있는 방법을 보여주었습니다 .
21. 우리는 사람들이 처음부터 새로운 악기 섹션을 만들고, 트래커 간에 스타일을 전송하는 등의 작업을 수행할 수 있는 음악 AI 도구 제품군인 Music AI Sandbox를 강조했습니다. 지금 YouTube에서 Wyclef Jean 의 곡 과 Marc Rebillet 의 곡을 포함하여 이러한 콜라보레이션의 새로운 곡을 찾아보실 수 있습니다 .
22. 그리고 아티스트와 Google 크리에이티브가 함께 실험하여 AI 모델을 미세 조정하여 소설 '이상한 나라의 앨리스'의 시각적 세계를 끝없이 재구성한 경험인 Infinite Wonderland 도 꼭 확인해 보세요 . Infinite Wonderland 의 독자들은 각 아티스트의 스타일에 따라 책에 포함된 1,200개의 문장 각각에 대해 무한해 보이는 이미지를 생성할 수 있습니다.
23. 우리는 Google DeepMind의 생성적 비디오 모델인 Veo를 사용하고 아이디어를 비디오 클립으로 전환할 수 있는 최신 실험 도구인 VideoFX를 발표했습니다 .
24. 또한 장면별로 반복하고 최종 비디오에 음악을 추가할 수 있는 스토리보드 모드도 함께 제공됩니다.
25. 커뮤니티에서 가장 많이 요청한 기능인 ImageFX 에 더 많은 편집 제어 기능을 추가했습니다. 따라서 이미지 위에 브러시를 대는 것만으로 요소를 추가, 제거 또는 변경할 수 있습니다.
26. ImageFX는 또한 Imagen 3를 사용하여 더욱 풍부한 디테일과 적은 시각적 아티팩트, 더욱 정확한 텍스트 렌더링으로 더욱 사실적인 느낌을 선사합니다.
27. MusicFX 에는 장르와 악기를 결합하여 비트를 믹싱하는 데 도움이 되는 "DJ 모드" 라는 새로운 기능이 있으며 생성 AI의 힘을 사용하여 음악 스토리에 생기를 불어넣습니다.
28. 이번 주부터 ImageFX와 MusicFX는 Labs를 통해 100개 이상의 국가에서 사용할 수 있습니다.
Gemini 앱으로 더 많은 작업을 수행하는 새로운 방법
29. 우리는 최첨단 모델인 Gemini 1.5 Pro를 Gemini Advanced 구독자에게 제공할 예정입니다. 즉, Gemini Advanced는 이제 100만 개의 토큰 컨텍스트 창을 가지며 1,500페이지 PDF를 이해하는 등의 작업을 수행할 수 있습니다.
30. 이는 또한 Gemini Advanced가 이제 전 세계에서 상업적으로 이용 가능한 챗봇 중 가장 큰 컨텍스트 창을 갖게 되었음을 의미합니다.
31. Google Drive를 통해 또는 장치에서 직접 Gemini Advanced로 파일을 업로드하는 기능을 추가했습니다.
32. 곧 Gemini Advanced는 데이터를 분석하여 통찰력을 신속하게 발견하고 스프레드시트와 같이 업로드된 데이터 파일에서 차트를 구축하는 데 도움을 줄 것입니다.
33. 여행자를 위한 좋은 소식: Gemini Advanced에는 제안된 활동 목록을 넘어서 실제로 귀하에게 꼭 맞는 맞춤형 여행 일정을 만들어주는 새로운 계획 기능이 있습니다.
34. Gemini Advanced 가입자를 위한 Gemini Live는 최첨단 음성 기술을 사용하여 Gemini와 보다 자연스럽고 직관적인 음성 대화를 할 수 있도록 도와주는 새로운 모바일 우선 대화 환경입니다.
35. Gemini Live를 사용하면 10가지 자연스러운 목소리 중에서 선택할 수 있습니다. 또한 자신의 속도에 맞춰 말하거나 명확한 질문으로 응답을 중단할 수도 있습니다.
36. 이제 Google 메시지의 Gemini를 사용하면 친구에게 메시지를 보내는 동일한 앱에서 Gemini와 채팅할 수 있습니다.
37. Gemini Advanced 구독자는 곧 귀하가 꿈꾸는 모든 것에 맞게 설계된 Gemini의 맞춤형 버전인 Gems를 만들 수 있게 됩니다. Gem에서 수행할 작업과 응답 방식을 간단히 설명하면 Gemini가 해당 지침을 받아 특정 요구 사항에 맞는 Gem을 생성합니다.
38. 그리고 Google Calendar, Tasks, Keep 및 Clock을 포함하여 Gemini에 연결되는 더 많은 Google 도구를 찾아보세요.
검색을 위한 업데이트
39. 우리는 다단계 추론, 계획, 다중 양식을 포함한 Gemini의 고급 기능을 동급 최고의 검색 시스템과 결합하기 위해 Google 검색에 맞게 맞춤화된 새로운 Gemini 모델을 사용하고 있습니다.
40. 검색의 AI 개요는 이번 주부터 미국의 모든 사람에게 출시될 예정이며 곧 더 많은 국가에서 출시될 예정입니다.
41. 그리고 다단계 추론 기능이 미국 내 영어 검색을 위한 Search Labs의 AI 개요에 곧 제공될 예정입니다. 따라서 질문을 여러 검색으로 나누는 대신 "보스턴에서 최고의 요가 또는 필라테스 스튜디오를 찾아보세요"와 같은 복잡한 질문을 할 수 있습니다. 소개 제안과 Beacon Hill에서의 도보 시간에 대한 세부 정보를 보여줍니다.”
42. 곧 주제를 처음 접하거나 주제의 핵심에 접근하려고 할 때 언어를 단순화하거나 더 자세히 분류하는 옵션을 사용하여 AI 개요를 조정할 수 있게 될 것입니다.
43. 검색에는 새로운 계획 기능도 추가되었습니다. 예를 들어 맞춤식 식사 및 여행 계획은 올해 말 Search Labs에서 출시될 예정이며 곧 파티 및 피트니스와 같은 더 많은 카테고리가 출시될 예정입니다.
44. 영상 이해의 발전 덕분에 이제 영상으로 질문할 수 있게 되었습니다. 검색은 복잡한 시각적 질문을 받아 이를 파악한 후 다음 단계를 설명하고 AI 개요를 통해 리소스를 제공할 수 있습니다.
45. 그리고 곧 검색의 생성적 AI는 사용자가 새로운 아이디어를 검색할 때 AI로 정리된 결과 페이지도 생성할 것입니다. 식사, 요리법, 영화, 음악, 서적, 호텔, 쇼핑 등과 같은 카테고리를 검색할 때 이러한 AI 구성 검색 결과 페이지를 사용할 수 있습니다.
Workspace 및 Photos에서 Gemini 모델의 도움말
46. Gemini 1.5 Pro는 이제 Workspace Labs를 통해 Gmail, Docs, Drive, Slides, Sheets의 측면 패널에서 사용할 수 있으며 다음 달 Gemini for Workspace 고객과 Google One AI Premium 구독자에게 출시될 예정입니다.
47. Gmail의 측면 패널을 사용하여 이메일을 요약하여 가장 중요한 세부정보와 작업 항목을 얻을 수 있습니다.
48. 요약 외에도 Gmail의 모바일 앱은 곧 Contextual Smart Reply와 Gmail Q&A라는 두 가지 새로운 기능에 Gemini를 사용할 예정입니다.
49. 앞으로 몇 주 안에 Gmail 및 Docs에서 글쓰기 도움말이 스페인어와 포르투갈어를 지원하게 됩니다.
50. 올해 후반에는 Labs에서 Gemini에게 드라이브의 이메일 첨부 파일을 자동으로 정리하고 데이터가 포함된 시트를 생성한 다음 데이터 Q&A로 분석하도록 요청할 수도 있습니다.
51. 사진에 물어보기(Ask Photos)라는 Google 포토의 새로운 실험적 기능을 사용 하면 특정 추억을 찾거나 갤러리에 포함된 정보를 더 쉽게 불러올 수 있습니다. 이 기능은 Gemini 모델을 사용하며 앞으로 몇 달에 걸쳐 출시될 예정입니다.
52. 또한 Ask Photos를 사용하여 최근 여행의 하이라이트 갤러리를 만들 수 있으며 소셜 미디어에서 공유할 수 있는 개인화된 캡션도 작성됩니다.
안드로이드 발전
53. 올해 말 Pixel을 시작으로 Android에 내장된 온디바이스 기반 모델인 Gemini Nano는 다중 모드 기능을 갖게 됩니다. Pixel 휴대전화는 단순히 텍스트 입력을 처리하는 것 외에도 광경, 소리, 음성 언어와 같은 맥락에서 더 많은 정보를 이해할 수 있습니다.
54. 시각 장애인 및 저시력 사용자가 터치 및 음성 피드백을 사용하여 장치와 더 잘 상호 작용할 수 있도록 돕는 Android 장치용 접근성 기능인 Talkback이 Multimodality를 지원하는 Gemini Nano 덕분에 개선되었습니다.
55. Gemini Nano의 온디바이스 AI를 사용하여 개인 정보를 보호하는 방식으로 사기 전화를 감지하는 데 도움이 되는 새로운 선택형 사기 방지 기능입니다. 자세한 내용은 올해 말에 확인하세요.
56. Circle to Search는 현재 1억 대 이상의 Android 기기에서 사용할 수 있으며, 올해 말까지 이를 두 배로 늘릴 예정이라고 발표했습니다.
57. 곧 Android에서 Gemini를 사용하여 생성된 이미지를 생성하고 Gmail, Google 메시지 등에 끌어다 놓거나 보고 있는 YouTube 동영상에 대해 질문할 수 있게 될 것입니다.
58. Gemini Advanced를 사용하는 경우 여러 페이지를 스크롤할 필요 없이 신속하게 답변을 얻을 수 있는 "이 PDF에 문의" 옵션도 제공됩니다.
59. 이제 학생들은 Circle을 사용하여 일부 Android 휴대폰 및 태블릿에서 직접 숙제 도움말을 검색할 수 있습니다. 이 기능은 학습에 맞게 미세 조정된 Gemini 기반의 새로운 모델 제품군인 LearnLM에서 제공됩니다.
60. 올해 말 Circle to Search는 기호 공식, 다이어그램, 그래프 등과 관련된 훨씬 더 복잡한 문제를 해결할 수 있을 것입니다.
61. 아, 그리고 Android 15의 두 번째 베타 버전을 출시했습니다.
62. 도난 감지 잠금 장치는 강력한 Google AI를 사용하여 기기가 도난당했는지 감지하고 휴대전화에 있는 정보를 신속하게 잠급니다.
63. 개인 공간이 Android 15에 출시됩니다. 이를 통해 열려면 추가 인증 계층이 필요한 별도의 공간 내에서 보안을 유지할 앱을 선택할 수 있습니다.
64. 그리고 사적인 공간을 위한 별도의 잠금화면만으로는 충분하지 않다면, 아예 잠금화면의 존재를 숨길 수도 있습니다.
65. 올해 후반에 Google Play Protect는 기기 내 AI를 사용하여 사기 또는 피싱에 가담하기 위해 자신의 활동을 숨기려고 시도하는 앱을 찾아내는 데 도움을 줄 것입니다.
66. Google 메시지의 RCS를 통해 일본에 업데이트된 메시징 환경을 제공할 예정입니다.
67. 곧 미국에서는 텍스트만 포함된 디지털 버전의 패스를 만들 수 있게 될 것입니다. 패스(보험 카드, 이벤트 티켓 등) 사진을 찍고 Google Wallet에 추가하면 빠르게 액세스할 수 있습니다.
68. 우리는 Google 지도에서 증강 현실 콘텐츠를 직접 사용할 수 있는 방법을 선보였으며 Android 생태계를 위해 Samsung 및 Qualcomm과 협력하여 구축하고 있는 확장 현실(XR) 플랫폼의 기반을 마련했습니다.
69. 이제 Max 및 Peacock에서 좋아하는 프로그램의 에피소드를 따라잡거나 Google이 내장된 일부 자동차에서 Angry Birds 게임을 시작할 수 있습니다.
70. 또한 앞으로 몇 달 안에 Rivian을 시작으로 Android 자동차 OS가 탑재된 자동차에 Google Cast를 도입할 예정이므로 휴대폰에서 자동차로 비디오 콘텐츠를 쉽게 전송할 수 있습니다.
71. 올해 말에는 Wear OS 5를 탑재한 시계에 배터리 수명 최적화 기능이 도입될 예정입니다. 예를 들어, 야외 마라톤을 달리는 경우 Wear OS 4를 탑재한 시계에 비해 전력 소비가 최대 20% 적습니다.
72. Wear OS 5는 또한 피트니스 앱에 지면 접촉 시간, 보폭, 수직 진동과 같은 더 많은 데이터 유형을 지원할 수 있는 옵션을 제공합니다.
73. 이제 Gemini 모델 덕분에 맞춤형 AI 생성 설명을 통해 Google TV 및 기타 Android TV OS 기기에서 시청할 콘텐츠를 선택하는 것이 더 쉬워졌습니다.
74. 이러한 AI 생성 설명은 영화 및 쇼에 대한 누락되거나 번역되지 않은 설명도 채웁니다.
75. 재미있는 통계는 다음과 같습니다. 출시 이후 사람들은 10억 번 이상의 빠른 쌍 연결을 만들었습니다.
76. 이번 달 말에는 Chipolo 및 PebbleBee(향후 더 많은 파트너 제공)의 Bluetooth 추적기 태그를 사용하여 빠른 페어링을 사용하여 내 장치 찾기 앱에서 열쇠, 지갑 또는 수하물과 같은 항목을 연결하고 찾을 수 있습니다.
개발자를 위한 개발
77. Gemini API 개발자 대회에 참여하여 가장 유용하고 획기적인 AI 앱을 발견하는 데 참여할 수 있습니다. 상품은 전기적으로 개조된 맞춤형 1981 DeLorean입니다.
78. 시각적 Q&A 및 이미지 캡션에 최적화된 최초의 비전 언어 개방형 모델인 PaliGemma를 출시했습니다 .
79. 우리는 Gemma의 다음 버전인 Gemma 2를 미리 보았습니다. 이는 완전히 새로운 아키텍처를 기반으로 구축되었으며 크기가 두 배인 모델보다 성능이 뛰어나고 단일 TPU 호스트에서 실행되는 더 큰 27B 매개변수 인스턴스를 포함합니다.
'Gemma 2'라는 제목의 검은 화면. 아래에는 "27B 매개변수. TPU 및 GPU에 최적화되었습니다. 2배 더 큰 모델보다 성능이 뛰어납니다."라고 적혀 있습니다.
80. 이제 개발자가 Android Studio, IDX, Firebase, Colab, VSCode, Cloud 및 Intelllj에서 생산성을 높이는 데 도움이 되는 Gemini 모델을 사용할 수 있습니다.
81. Gemini 1.5 Pro는 올해 후반에 Android Studio에 출시될 예정입니다. 큰 컨텍스트 창이 장착된 이 모델은 더 높은 품질의 응답으로 이어지며 다중 모드 입력과 같은 사용 사례를 잠금 해제합니다.
82. Google AI Studio는 이제 영국과 EU를 포함한 200개 이상의 국가에서 사용할 수 있습니다.
83. 이제 Gemini API에서 병렬 함수 호출 및 비디오 프레임 추출이 지원됩니다.
84. 그리고 다음 달에 출시될 Gemini API의 새로운 컨텍스트 캐싱 기능을 사용하면 자주 사용되는 컨텍스트 파일을 저렴한 비용으로 캐싱하여 대규모 프롬프트에 대한 워크플로를 간소화할 수 있습니다.
85. Android는 이제 개발자가 플랫폼 전반에 걸쳐 앱의 비즈니스 로직을 공유할 수 있도록 Kotlin 다중 플랫폼에 대한 최고 수준의 지원을 제공합니다.
86. 크기 조정 가능한 에뮬레이터, Compose UI 확인 모드 및 Firebase에서 제공하는 Android 기기 스트리밍은 개발자가 모든 폼 팩터에 맞게 구축하는 데 도움이 될 수 있는 새로운 제품입니다.
87. Chrome 126부터 Gemini Nano는 Chrome 데스크톱 클라이언트에 내장됩니다.
88. 많은 요청을 받은 기능인 다중 페이지 앱용 View Transitions API를 이제 사용할 수 있으므로 개발자는 사이트 아키텍처에 관계없이 원활하고 유동적인 앱과 같은 탐색을 쉽게 구축할 수 있습니다.
89. 풀스택, 멀티플랫폼 앱을 위한 새로운 통합 개발자 환경인 Project IDX를 이제 누구나 시험해 볼 수 있습니다.
90. Firebase는 Firebase Genkit 베타 버전을 출시했습니다. 이를 통해 개발자는 생성적 AI 경험을 앱에 더욱 쉽게 구축할 수 있습니다.
91. Firebase는 또한 개발자가 Google Cloud SQL을 통해 Firebase에서 SQL을 사용할 수 있는 새로운 방법인 Firebase Data Connect를 출시했습니다. 이렇게 하면 SQL 워크플로를 Firebase로 가져올 수 있을 뿐만 아니라 개발자가 작성해야 하는 앱 코드의 양도 줄어듭니다.
92. 우리는 James Manyika, Jeff Dean 및 Koray Kavukcuoglu와 함께 AI를 강화하는 기술 및 연구에 대한 심층적인 대화를 통해 개발자들을 심층적으로 대화했습니다 .
책임 있는 AI 진행
93. 우리는 “AI 지원 레드팀”이라고 부르는 새로운 기술을 통해 자체 시스템의 약점을 사전에 테스트하고 이를 깨뜨리려고 노력하는 검증된 관행인 레드팀을 강화하고 있습니다 .
94. 우리는 또한 SynthID를 텍스트와 비디오라는 두 가지 새로운 형식으로 확장하고 있습니다.
95. SynthID 텍스트 워터마킹은 업데이트된 Responsible Generative AI 툴킷을 통해 앞으로 몇 달 안에 오픈 소스로 제공될 예정입니다.
96. 우리는 Gemini를 기반으로 하고 학습에 맞게 미세 조정된 새로운 모델 제품군인 LearnLM을 발표했습니다. LearnLM은 이미 Gemini, 검색, YouTube, Google 클래스룸을 비롯한 당사 제품 전반에 걸쳐 다양한 기능을 지원하고 있습니다.
97. 우리는 Columbia Teachers College, Arizona State University, NYU Tisch 및 Khan Academy와 같은 기관의 전문가와 협력하여 LearnLM을 제품 이상으로 개선하고 확장할 것입니다.
98. 또한 우리는 MIT RAISE와 협력하여 교육자가 교실에서 생성 AI를 효과적으로 사용할 수 있도록 지원하는 온라인 과정을 개발했습니다.
99. 우리는 지식에 더 쉽게 접근하고 소화할 수 있도록 Illuminate 라는 새로운 실험 도구를 만들었습니다 .
100. luminate는 두 개의 AI 생성 음성으로 구성된 대화를 생성하여 연구 논문의 주요 통찰력에 대한 개요를 제공할 수 있습니다. 지금 labs.google 에서 등록하여 사용해 볼 수 있습니다 .