DSGA-3001 Reinforcement Learning Final Project

gym-junqi & Vision/Language/Tensor A2C_PPO

Installation

conda create -n junqi python=3.10.0
conda activate junqi
pip install -r requirements.txt
pip install -e ./LLaVA
pip install -e ./gym-cards

cd RL4VLM/gym-junqi/gym_junqi
python examples/game_mode.py

cd RL4VLM/VLM_PPO/scripts
bash run_nl.sh

Name		Name	Last commit message	Last commit date
Latest commit History 44 Commits
LLaVA		LLaVA
VLM_PPO		VLM_PPO
gym-cards		gym-cards
gym-junqi		gym-junqi
imgs		imgs
.gitignore		.gitignore
LICENSE.txt		LICENSE.txt
README.md		README.md
diff_output.txt		diff_output.txt
finetune.sh		finetune.sh
requirements.txt		requirements.txt