use alloc::{ sync::{Arc, Weak}, vec::Vec, }; use bitmap::AllocBitmap; use hashbrown::HashMap; use log::debug; use system_error::SystemError; use crate::{ arch::{vm::mmu::kvm_mmu::PAGE_SIZE, MMArch}, libs::{ rbtree::RBTree, rwlock::{RwLock, RwLockReadGuard, RwLockWriteGuard}, spinlock::{SpinLock, SpinLockGuard}, }, mm::{kernel_mapper::KernelMapper, page::EntryFlags, MemoryManagementArch, VirtAddr}, virt::{ kvm::host_mem::PAGE_SHIFT, vm::{kvm_host::KVM_ADDRESS_SPACE_NUM, user_api::KvmUserspaceMemoryRegion}, }, }; use super::{LockedVm, Vm}; pub const KVM_USER_MEM_SLOTS: u16 = u16::MAX; pub const KVM_INTERNAL_MEM_SLOTS: u16 = 3; pub const KVM_MEM_SLOTS_NUM: u16 = KVM_USER_MEM_SLOTS - KVM_INTERNAL_MEM_SLOTS; pub const KVM_MEM_MAX_NR_PAGES: usize = (1 << 31) - 1; // pub const APIC_ACCESS_PAGE_PRIVATE_MEMSLOT: u16 = KVM_MEM_SLOTS_NUM + 1; /// 对于普通的页帧号（PFN），最高的12位应该为零， /// 因此我们可以mask位62到位52来表示错误的PFN， /// mask位63来表示无槽的PFN。 // const KVM_PFN_ERR_MASK: u64 = 0x7ff << 52; //0x7FF0000000000000 // const KVM_PFN_ERR_NOSLOT_MASK: u64 = 0xfff << 52; //0xFFF0000000000000 // const KVM_PFN_NOSLOT: u64 = 1 << 63; //0x8000000000000000 // const KVM_PFN_ERR_FAULT: u64 = KVM_PFN_ERR_MASK; // const KVM_PFN_ERR_HWPOISON: u64 = KVM_PFN_ERR_MASK + 1; // const KVM_PFN_ERR_RO_FAULT: u64 = KVM_PFN_ERR_MASK + 2; // const KVM_PFN_ERR_SIGPENDING: u64 = KVM_PFN_ERR_MASK + 3; #[derive(Debug, Default)] #[allow(dead_code)] pub struct KvmMmuMemoryCache { gfp_zero: u32, gfp_custom: u32, capacity: usize, nobjs: usize, objects: Option>, } impl KvmMmuMemoryCache { #[allow(dead_code)] pub fn kvm_mmu_totup_memory_cache( &mut self, _capacity: usize, _min: usize, ) -> Result<(), SystemError> { // let gfp = if self.gfp_custom != 0 { // self.gfp_custom // } else { // todo!(); // }; // if self.nobjs >= min { // return Ok(()); // } // if unlikely(self.objects.is_none()) { // if self.capacity == 0 { // return Err(SystemError::EIO); // } // // self.objects = Some(Box::new) // } Ok(()) } } #[derive(Debug, PartialEq, Eq, PartialOrd, Ord, Clone, Copy, Default)] pub struct AddrRange { pub start: VirtAddr, pub last: VirtAddr, } #[derive(Debug, Default)] pub struct KvmMemSlotSet { /// 最后一次使用到的内存插槽 pub last_use: Option>, /// 存储虚拟地址（hva）和内存插槽之间的映射关系 hva_tree: RBTree>, /// 用于存储全局页帧号（gfn）和内存插槽之间的映射关系 pub gfn_tree: RBTree>, /// 将内存插槽的ID映射到对应的内存插槽。 slots: HashMap>, pub node_idx: usize, pub generation: u64, } impl KvmMemSlotSet { pub fn get_slot(&self, id: u16) -> Option> { self.slots.get(&id).cloned() } } #[derive(Debug)] pub struct LockedKvmMemSlot { inner: RwLock, } impl LockedKvmMemSlot { pub fn new() -> Arc { Arc::new(Self { inner: RwLock::new(KvmMemSlot::default()), }) } #[inline] pub fn read(&self) -> RwLockReadGuard { self.inner.read() } #[inline] pub fn write(&self) -> RwLockWriteGuard { self.inner.write() } #[inline] pub fn copy_from(&self, other: &Arc) { let mut guard = self.write(); let other = other.read(); guard.base_gfn = other.base_gfn; guard.npages = other.npages; guard.dirty_bitmap = other.dirty_bitmap.clone(); guard.arch = other.arch; guard.userspace_addr = other.userspace_addr; guard.flags = other.flags; guard.id = other.id; guard.as_id = other.as_id; } } #[derive(Debug, Default)] pub struct KvmMemSlot { /// 首个gfn pub base_gfn: u64, /// 页数量 pub npages: usize, /// 脏页位图 dirty_bitmap: Option, /// 架构相关 arch: (), userspace_addr: VirtAddr, flags: UserMemRegionFlag, id: u16, as_id: u16, hva_node_key: [AddrRange; 2], } #[allow(dead_code)] impl KvmMemSlot { pub fn check_aligned_addr(&self, align: usize) -> bool { self.userspace_addr.data() % align == 0 } pub fn get_flags(&self) -> UserMemRegionFlag { self.flags } pub fn get_id(&self) -> u16 { self.id } // 检查内存槽是否可见 pub fn is_visible(&self) -> bool { self.id < KVM_USER_MEM_SLOTS && (self.flags.bits() & UserMemRegionFlag::KVM_MEMSLOT_INVALID.bits()) == 0 } } #[derive(Debug)] pub struct LockedVmMemSlotSet { inner: SpinLock, } impl LockedVmMemSlotSet { pub fn new(slots: KvmMemSlotSet) -> Arc { Arc::new(Self { inner: SpinLock::new(slots), }) } pub fn lock(&self) -> SpinLockGuard { self.inner.lock() } } #[derive(Debug, Default)] #[allow(dead_code)] pub struct GfnToHvaCache { generation: u64, /// 客户机对应物理地址（Guest Physical Address） gpa: u64, /// 主机用户空间虚拟地址（User Host Virtual Address） uhva: Option, /// 主机内核空间虚拟地址（Kernel Host Virtual Address） khva: u64, /// 对应内存插槽 memslot: Option>, /// 对应物理页帧号(Page Frame Number) pfn: Option, /// 缓存项的使用情况 usage: PfnCacheUsage, /// 是否处于活动状态 active: bool, /// 是否有效 valid: bool, vm: Option>, } impl GfnToHvaCache { pub fn init(vm: Weak, usage: PfnCacheUsage) -> Self { // check_stack_usage(); // let mut ret: Box = unsafe { Box::new_zeroed().assume_init() }; // ret.usage = usage; // ret.vm = Some(vm); // *ret Self { usage, vm: Some(vm), ..Default::default() } } } bitflags! { #[derive(Default)] pub struct PfnCacheUsage: u8 { const GUEST_USES_PFN = 1 << 0; const HOST_USES_PFN = 1 << 1; const GUEST_AND_HOST_USES_PFN = Self::GUEST_USES_PFN.bits | Self::HOST_USES_PFN.bits; } pub struct UserMemRegionFlag: u32 { /// 用来开启内存脏页 const LOG_DIRTY_PAGES = 1 << 0; /// 开启内存只读 const READONLY = 1 << 1; /// 标记invalid const KVM_MEMSLOT_INVALID = 1 << 16; } } impl Default for UserMemRegionFlag { fn default() -> Self { Self::empty() } } #[derive(PartialEq, Eq, Debug, Clone, Copy)] pub enum KvmMemoryChangeMode { Create, Delete, Move, FlagsOnly, } impl Vm { #[inline(never)] pub fn set_memory_region(&mut self, mem: KvmUserspaceMemoryRegion) -> Result<(), SystemError> { if mem.slot >= u16::MAX as u32 { return Err(SystemError::EINVAL); } let as_id = mem.slot >> 16; let id = mem.slot as u16; // 检查内存对齐以及32位检测（虽然现在没什么用<） if (mem.memory_size as usize & MMArch::PAGE_SIZE != 0) || mem.memory_size != mem.memory_size as usize as u64 { return Err(SystemError::EINVAL); } if !mem.guest_phys_addr.check_aligned(MMArch::PAGE_SIZE) { return Err(SystemError::EINVAL); } if !mem.userspace_addr.check_aligned(MMArch::PAGE_SIZE) { // 这里应该还需要判断从userspace_addr->userspace_addr+memory_size这段区间都是合法的 return Err(SystemError::EINVAL); } if as_id >= KVM_ADDRESS_SPACE_NUM as u32 || id >= KVM_MEM_SLOTS_NUM { return Err(SystemError::EINVAL); } if (mem.memory_size >> MMArch::PAGE_SHIFT) > KVM_MEM_MAX_NR_PAGES as u64 { return Err(SystemError::EINVAL); } let slots = self.memslot_set(as_id as usize).clone(); let slots_guard = slots.lock(); let old = slots_guard.get_slot(id); if mem.memory_size == 0 { if let Some(old) = &old { let old_npages = old.read().npages; if old_npages == 0 { return Err(SystemError::EINVAL); } if self.nr_memslot_pages < old_npages { return Err(SystemError::EIO); } drop(slots_guard); return self.set_memslot(Some(old), None, KvmMemoryChangeMode::Delete); } else { return Err(SystemError::EINVAL); } } let base_gfn = (mem.guest_phys_addr.data() >> MMArch::PAGE_SHIFT) as u64; let npages = mem.memory_size >> MMArch::PAGE_SHIFT; let change; if let Some(old) = &old { let old_guard = old.read(); if old_guard.npages == 0 { change = KvmMemoryChangeMode::Create; // 避免溢出 if let Some(new_pages) = self.nr_memslot_pages.checked_add(npages as usize) { if new_pages < self.nr_memslot_pages { return Err(SystemError::EINVAL); } } else { return Err(SystemError::EINVAL); } } else { if mem.userspace_addr != old_guard.userspace_addr || npages != old_guard.npages as u64 || (mem.flags ^ old_guard.flags).contains(UserMemRegionFlag::READONLY) { return Err(SystemError::EINVAL); } if base_gfn != old_guard.base_gfn { change = KvmMemoryChangeMode::Move; } else if mem.flags != old_guard.flags { change = KvmMemoryChangeMode::FlagsOnly; } else { return Ok(()); } } } else { change = KvmMemoryChangeMode::Create; // 避免溢出 if let Some(new_pages) = self.nr_memslot_pages.checked_add(npages as usize) { if new_pages < self.nr_memslot_pages { return Err(SystemError::EINVAL); } } else { return Err(SystemError::EINVAL); } }; if (change == KvmMemoryChangeMode::Create || change == KvmMemoryChangeMode::Move) && slots_guard.gfn_tree.contains_key(&base_gfn) { return Err(SystemError::EEXIST); } let new = LockedKvmMemSlot::new(); let mut new_guard = new.write(); new_guard.as_id = as_id as u16; new_guard.id = id; new_guard.base_gfn = base_gfn; new_guard.npages = npages as usize; new_guard.flags = mem.flags; new_guard.userspace_addr = mem.userspace_addr; drop(new_guard); drop(slots_guard); return self.set_memslot(old.as_ref(), Some(&new), change); } #[allow(clippy::modulo_one)] #[inline] /// 获取活动内存插槽 fn memslot_set(&self, id: usize) -> &Arc { // 避免越界 let id = id % KVM_ADDRESS_SPACE_NUM; &self.memslots[id] } #[inline(never)] fn set_memslot( &mut self, old: Option<&Arc>, new: Option<&Arc>, change: KvmMemoryChangeMode, ) -> Result<(), SystemError> { let invalid_slot = LockedKvmMemSlot::new(); if change == KvmMemoryChangeMode::Delete || change == KvmMemoryChangeMode::Move { self.invalidate_memslot(old.unwrap(), &invalid_slot) } match self.prepare_memory_region(old, new, change) { Ok(_) => {} Err(e) => { if change == KvmMemoryChangeMode::Delete || change == KvmMemoryChangeMode::Move { self.active_memslot(Some(&invalid_slot), old) } return Err(e); } } match change { KvmMemoryChangeMode::Create => self.create_memslot(new), KvmMemoryChangeMode::Delete => self.delete_memslot(old, &invalid_slot), KvmMemoryChangeMode::Move => self.move_memslot(old, new, &invalid_slot), KvmMemoryChangeMode::FlagsOnly => self.update_flags_memslot(old, new), } // TODO:kvm_commit_memory_region(kvm, old, new, change); Ok(()) } fn create_memslot(&mut self, new: Option<&Arc>) { self.replace_memslot(None, new); self.active_memslot(None, new); } fn delete_memslot( &mut self, old: Option<&Arc>, invalid_slot: &Arc, ) { self.replace_memslot(old, None); self.active_memslot(Some(invalid_slot), None); } fn move_memslot( &mut self, old: Option<&Arc>, new: Option<&Arc>, invalid_slot: &Arc, ) { self.replace_memslot(old, new); self.active_memslot(Some(invalid_slot), new); } fn update_flags_memslot( &mut self, old: Option<&Arc>, new: Option<&Arc>, ) { self.replace_memslot(old, new); self.active_memslot(old, new); } fn prepare_memory_region( &self, old: Option<&Arc>, new: Option<&Arc>, change: KvmMemoryChangeMode, ) -> Result<(), SystemError> { if change != KvmMemoryChangeMode::Delete { let new = new.unwrap(); let mut new_guard = new.write(); if !new_guard.flags.contains(UserMemRegionFlag::LOG_DIRTY_PAGES) { new_guard.dirty_bitmap = None; } else if old.is_some() { let old_guard = old.unwrap().read(); if old_guard.dirty_bitmap.is_some() { new_guard.dirty_bitmap = old_guard.dirty_bitmap.clone(); } else { new_guard.dirty_bitmap = Some(AllocBitmap::new(new_guard.npages * 2)); } } } return self.arch_prepare_memory_region(old, new, change); } fn invalidate_memslot( &mut self, old: &Arc, invalid_slot: &Arc, ) { invalid_slot.copy_from(old); let mut old_guard = old.write(); let mut invalid_slot_guard = invalid_slot.write(); invalid_slot_guard .flags .insert(UserMemRegionFlag::KVM_MEMSLOT_INVALID); self.swap_active_memslots(old_guard.as_id as usize); old_guard.arch = invalid_slot_guard.arch; } #[inline(never)] fn active_memslot( &mut self, old: Option<&Arc>, new: Option<&Arc>, ) { let as_id = if let Some(slot) = old.or(new) { slot.read().as_id } else { 0 }; self.swap_active_memslots(as_id as usize); self.replace_memslot(old, new); } #[inline(never)] fn replace_memslot( &self, old: Option<&Arc>, new: Option<&Arc>, ) { let as_id = if let Some(slot) = old.or(new) { slot.read().as_id } else { 0 }; let slot_set = self.get_inactive_memslot_set(as_id as usize); let mut slots_guard = slot_set.lock(); let idx = slots_guard.node_idx; if let Some(old) = old { slots_guard.hva_tree.remove(&old.read().hva_node_key[idx]); if let Some(last) = &slots_guard.last_use { if Arc::ptr_eq(last, old) { slots_guard.last_use = new.cloned(); } } if new.is_none() { slots_guard.gfn_tree.remove(&old.read().base_gfn); return; } } let new = new.unwrap(); let mut new_guard = new.write(); new_guard.hva_node_key[idx].start = new_guard.userspace_addr; new_guard.hva_node_key[idx].last = new_guard.userspace_addr + VirtAddr::new((new_guard.npages << MMArch::PAGE_SHIFT) - 1); slots_guard .hva_tree .insert(new_guard.hva_node_key[idx], new.clone()); if let Some(old) = old { slots_guard.gfn_tree.remove(&old.read().base_gfn); } slots_guard.gfn_tree.insert(new_guard.base_gfn, new.clone()); } fn get_inactive_memslot_set(&self, as_id: usize) -> Arc { let active = self.memslot_set(as_id); let inactive_idx = active.lock().node_idx ^ 1; return self.memslots_set[as_id][inactive_idx].clone(); } fn swap_active_memslots(&mut self, as_id: usize) { self.memslots[as_id] = self.get_inactive_memslot_set(as_id); } } /// 将给定的客户机帧号（GFN）转换为用户空间虚拟地址（HVA），并根据内存槽的状态和标志进行相应的检查。 /// /// # 参数 /// - `slot`: 可选的 `KvmMemSlot`，表示内存槽。 /// - `gfn`: 客户机帧号（GFN），表示要转换的帧号。 /// - `nr_pages`: 可选的可变引用，用于存储计算出的页数。 /// - `write`: 布尔值，表示是否为写操作。 /// /// # 返回 /// 如果成功，返回转换后的用户空间虚拟地址（HVA）；如果失败，返回相应的错误。 /// /// # 错误 /// 如果内存槽为空或无效，或者尝试对只读内存槽进行写操作，则返回 `SystemError::KVM_HVA_ERR_BAD`。 pub fn __gfn_to_hva_many( slot: &Option<&KvmMemSlot>, gfn: u64, nr_pages: Option<&mut u64>, write: bool, ) -> Result { debug!("__gfn_to_hva_many"); // 检查内存槽是否为空 if slot.is_none() { return Err(SystemError::KVM_HVA_ERR_BAD); } let slot = slot.as_ref().unwrap(); // 检查内存槽是否无效或尝试对只读内存槽进行写操作 if slot.flags.bits() & UserMemRegionFlag::KVM_MEMSLOT_INVALID.bits() != 0 || (slot.flags.bits() & UserMemRegionFlag::READONLY.bits() != 0) && write { return Err(SystemError::KVM_HVA_ERR_BAD); } // 如果 `nr_pages` 不为空，计算并更新页数 if let Some(nr_pages) = nr_pages { *nr_pages = slot.npages as u64 - (gfn - slot.base_gfn); } // 调用辅助函数将 GFN 转换为 HVA return Ok(__gfn_to_hva_memslot(slot, gfn)); } /// 将给定的全局帧号（GFN）转换为用户空间虚拟地址（HVA）。 /// /// # 参数 /// - `slot`: `KvmMemSlot`，表示内存槽。 /// - `gfn`: 全局帧号（GFN），表示要转换的帧号。 /// /// # 返回 /// 转换后的用户空间虚拟地址（HVA）。 fn __gfn_to_hva_memslot(slot: &KvmMemSlot, gfn: u64) -> u64 { return slot.userspace_addr.data() as u64 + (gfn - slot.base_gfn) * PAGE_SIZE; } /// 将给定的全局帧号（GFN）转换为页帧号（PFN），并根据内存槽的状态和标志进行相应的检查。 /// /// # 参数 /// - `slot`: 内存槽的引用。 /// - `gfn`: 全局帧号（GFN），表示要转换的帧号。 /// - `atomic`: 布尔值，表示是否为原子操作。 /// - `interruptible`: 布尔值，表示操作是否可中断。 /// - `async`: 可变引用，表示操作是否为异步。 /// - `write_fault`: 布尔值，表示是否为写操作。 /// - `writable`: 可变引用，表示是否可写。 /// - `hva`: 可变引用，表示用户空间虚拟地址（HVA）。 /// /// # 返回 /// 如果成功，返回转换后的页帧号（PFN）；如果失败，返回相应的错误。 pub fn __gfn_to_pfn_memslot( slot: Option<&KvmMemSlot>, gfn: u64, atomic_or_async: (bool, &mut bool), interruptible: bool, write: bool, writable: &mut bool, hva: &mut u64, ) -> Result { let addr = __gfn_to_hva_many(&slot, gfn, None, write)?; *hva = addr; //todo:检查地址是否为错误 // 如果内存槽为只读，且 writable 不为空，则更新 writable 的值 if slot.unwrap().flags.bits() & UserMemRegionFlag::READONLY.bits() != 0 { *writable = false; } let pfn = hva_to_pfn(addr, atomic_or_async, interruptible, write, writable)?; return Ok(pfn); } /// 将用户空间虚拟地址（HVA）转换为页帧号（PFN）。 /// /// # 参数 /// - `addr`: 用户空间虚拟地址（HVA）。 /// - `atomic`: 布尔值，表示是否为原子操作。 /// - `interruptible`: 布尔值，表示操作是否可中断。 /// - `is_async`: 可变引用，表示操作是否为异步。 /// - `write_fault`: 布尔值，表示是否为写操作。 /// - `writable`: 可变引用，表示是否可写。 /// /// # 返回 /// 如果成功，返回转换后的页帧号（PFN）；如果失败，返回相应的错误。 // 正确性待验证 pub fn hva_to_pfn( addr: u64, atomic_or_async: (bool, &mut bool), _interruptible: bool, _write_fault: bool, _writable: &mut bool, ) -> Result { // 我们可以原子地或异步地执行，但不能同时执行 assert!( !(atomic_or_async.0 && *atomic_or_async.1), "Cannot be both atomic and async" ); debug!("hva_to_pfn"); // let hpa = MMArch::virt_2_phys(VirtAddr::new(addr)).unwrap().data() as u64; let hva = VirtAddr::new(addr as usize); let mut mapper = KernelMapper::lock(); let mapper = mapper.as_mut().unwrap(); if let Some((hpa, _)) = mapper.translate(hva) { return Ok(hpa.data() as u64 >> PAGE_SHIFT); } debug!("hva_to_pfn NOT FOUND,try map a new pfn"); unsafe { mapper.map(hva, EntryFlags::mmio_flags()); } let (hpa, _) = mapper.translate(hva).unwrap(); return Ok(hpa.data() as u64 >> PAGE_SHIFT); }