맥북에서 돌려보는 비전 랭귀지 모델 LLaVA-MLX

LLaVA = Large Language and Vision Assistant이미지를 보고 자연어로 대화할 수 있는 멀티모달 AI MLX = Machine Learning XApple의 머신러닝 프레임워크 LLaVA 모델을 다운받아서Apple Silicon 최적화를 살짝해서Python Flask 웹 인터페이스를 붙였습니다. 설치방법+소스는 댓글 링크 참고하세요.바이브코딩으로 세팅해서 세밀한 설정은 저도 잘 몰라요. 🙂 [특징]– LLaVA 모델: 검증된 오픈소스 Vision Language Model… Continue reading